Google 开源集成学习工具 AdaNet
近日谷歌开源 AdaNet,一种组合多种机器学习算法以获得更好的预测分析结果的集成学习工具。谷歌表示,AdaNet 建立在强化学习和基于进化的 AutoML,在学习的同时可以保持快速灵活,而更重要的是 AdaNet 提供了一个通用框架,不仅可以学习神经网络架构,还可以通过集成学习获得更好的模型。
AdaNet 提供以下特征:
- Estimator API,可轻松训练、评估和服务 AdaNet 模型。
- 学习在 TensorFlow 中集成用户定义的子网。
- 用于在单个 train() 调用中搜索子网架构和参数的接口。
- 关于 CPU 和 GPU 的分布式训练(TPU 支持正在中)。
- 一流的 TensorBoard 集成。
- 提供理论学习。
集成学习(Ensemble learning)是将不同机器学习模型预测结合起来的技术,广泛用于神经网络。得益于丰富的经验和理论保证,集成学习在许多 Kaggle 竞赛中取得了成功,例如 Netflix Prize。
为了更容易实现,AdaNet 插入 TensorFlow Estimator 以将基本信息集中到一个地方,TensorBoard 也是如此,它在训练 AI 模型时提供视觉反馈。而对于那些想要更多控制流程的机器学习用户,他们可以使用 TensorFlow API 定义自己的子网,自定义丢失功能或调整其它设置。