人工智能训练平台
适用于高性能计算(HPC)和人工智能(AI)的基础集群管理
助力企业提高资源利用率
智能高性能计算平台(AiHPC)是一款用于高性能计算(HPC)和人工智能(AI)的基础集群管理软件。为客户提供可视化管理界面,极简有效的管理操作,稳定可靠的并发计算,自动灵活的容器平台,全面细致的资源监控。目前在高校科研、自动驾驶、智能视频分析、金融等行业客户成功使用,帮助客户解决AI训练过程中的复杂流程,让客户更专注于应用算法的开发。
助力企业减轻负担、提高效率
核心功能
基于主流开源框架开发,性能高,适配能力强
描述
Slurm、 kubernetes、Docker 
采用Slurm作业调度程序和kubernetes容器技术结合
 
保证用户作业相对独立,有效实现资源隔离

提高资源利用率,尽可能发挥出集群的最佳性能
01
描述
BeeGFS
针对海量小文件储存优化过的分布式并行文件系统
 
易用性、灵活性及性能上的独特优势

适应HPC和AI用户的不同业务需求

02
描述
NVIDIA GPU Operator
自动化集成管理 GPU 所需的 NVIDIA 软件组件

GPU节点管理方便

组件容器化
04
描述
Ansible、Prometheus、Grafana
整合Ansible、Prometheus、Grafana等组件构成AiHPC软件栈
 
形成功能齐全的一站式集群管理解决方案

03
软硬件综合的完整体系产品
描述
产学研合作
与华南理工大学广东省计算网络实验室合作共同研发
描述
软件架构
整合了并行计算任务调度管理、容器调度管理、高性能分布式存储、自动化监控运维等功能模块

描述
技术整合
从基础研究到方法论,再到软硬件构建了完整方案,形成完整体系的产品
描述
硬件支持
结合公司的硬件产品能够为人工智能、大数据、科研计算提供高性能的计算及存储资源
blankimg
blankimg
blankimg
blankimg
blankimg
描述
应用场景
科学研究
科学研究 气象预报 高能物理 分子计算 ........
社会经济
社会经济 电子商务 道路规划 教育医疗 ........
人工智能
人工智能 自动驾驶 智能语音 人脸识别 ........