Kubeflow 公佈1.0 路線圖:2019 年實現API 穩定
Kubeflow,名字取自 Kubernetes + Tensorflow ,是Google 為了支持Tensorflow 的部署而推出的開源平台。Kubeflow 旨在使Kubernetes 上的機器學習變的輕鬆、便捷、可擴展,其目標不是重建其他服務,而是提供一種簡便的方式找到最好的OSS 解決方案。Kubeflow 的目標是通過發揮Kubernetes 的特長,從而更便捷地運用機器學習:
- 在不同的基礎設施上實現簡單、可重複的便攜式部署
- 部署和管理鬆散耦合的微服務
- 根據需求進行擴展
Kubeflow於2017年底正式開源,並於2018年5月發布了首個0.1版本,之後陸續發布了0.2、0.3和0.4 RC版本。截至2018年12月18日,Kubeflow已有100多個活躍成員,得到 30多個組織的支持。
Kubeflow產品管理團隊近日發布了2018年度回顧和2019新年計劃,並表示目前正在努力讓Kubeflow達到第一個主要版本1.0 。這將是項目的一個重要里程碑,計劃在2019年上半年準備就緒。
Kubeflow 1.0 的重點將圍繞:
- API 穩定;
- PyTorch 相關問題
- TFJob 相關問題
- 強大的監控和日誌記錄
- 擴展和負載測試
- 集成超參數調優
- 高級數據管理
往更高層面來說,Kubeflow 1.0 關注的重點包括:
- 面向企業就緒
- 改進部署和體驗
- 實現高級ML 工作流程
- 基礎設施完善
- ……
更多細節可查閱:Kubeflow 2019 roadmap