DVC

DVC
软件描述
数据版本控制(DVC)是一个用于数据科学和机器学习项目的开源工具。主要特性:
官方网站
访问软件的官方网站了解更多信息
dvc.org
安全链接HTTPS
什么是 DVC?
数据版本控制(DVC)是一个用于数据科学和机器学习项目的开源工具。主要特性如下:
- 简单的命令行操作体验,类似 Git。无需安装和维护任何数据库,也不依赖任何专有的在线服务。
- 数据集和机器学习模型的管理与版本控制。数据可存储于 S3、Google Cloud、Azure、阿里云、SSH 服务器、HDFS,甚至本地硬盘 RAID。
- 使项目可复现且可共享,有助于回答关于模型如何构建的问题。
- 通过 Git 标签/分支管理实验,并支持指标跟踪。
DVC 的目标是取代经常被用作知识库和团队账本的电子表格和文档共享工具(如 Excel 或 Google Docs)。DVC 还取代了用于跟踪、移动和部署不同模型版本的临时脚本,以及临时的数据文件后缀和前缀命名方式。