XLearning平台将大数据与深度学习相融合,基于Hadoop Yarn完成了对TensorFlow、MXNet、Caffe、Theano、PyTorch、Keras、XGBoost等常用深度学习框架的集成,是典型的“AI on Hadoop”的实现。XLearning平台从2017年4月份正式开发上线运行,经多次版本迭代更新,为各学习框架的使用者提供了统一、稳定的调度平台,实现了资源共享,极大的提高了资源利用率,并且具有良好的扩展性和兼容性。
XLearning平台系统包括三种组件:Client、ApplicationMaster(AM)和Container。其中,Client负责启动作业及获取作业执行状态;AM负责输入数据分片、启动及管理Container、执行日志保存等;Container是作业的实际执行者,负责启动Worker或PS(Parameter Server)进程,监控并向AM汇报进程状态,上传作业的输出等。
XLearning平台支持同一个深度学习框架的多版本和自定义版本,满足用户个性化需求,不受限于集群机器上各学习框架的安装版本。同时,XLearning平台提供可视化界面用于展示作业执行进度和输出日志等内容,方便用户查看作业信息。
总之,XLearning平台是一款功能强大的深度学习调度平台,具有良好的扩展性和兼容性,可支持多种机器学习、深度学习框架的调度。
还木有评论哦,快来抢沙发吧~