位置:编程技术网 > 游戏开发 > 正文 >

【IPO价值观】AI训练数据提供商海天瑞声再度IPO 业绩依赖前五大客户

2020年08月12日 23:54来源:未知手机版

今天限行,顺口溜,梅州客天下门票


>

尤其是2016年AlphaGo的问世,使得AI正式进入大众视野,各行各业开始刮起一阵AI飓风,一时间风光无两,不仅受到资本投资界的广泛关注,国内AI企业数量也接连创下了新高。但随着AI与行业的深度结合,AI去泡沫化成为行业发展主旋律,技术与行业的应用开始回归理性,投资界对AI的投资热度也开始渐退。

为了获得更多的资金背书,加速IPO上市成为了AI企业的不二之选。近日继寒武纪之后,又一家AI企业申请科创板上市,它便是北京海天瑞声科技股份有限公司(简称“海天瑞声”)。

集微网了解到,海天瑞声主要从事AI训练数据的研发设计、生产及销售业务。具体来看,其主要通过设计数据集结构、组织数据采集、对取得的原料数据进行加工,最终形成可供AI算法模型训练使用的专业数据集。

目前,海天瑞声提供的训练数据覆盖智能语音(语音识别、语音合成等)、计算机视觉、自然语言等多个AI核心领域,全面服务于人机交互、智能驾驶、智慧城市等多种创新应用场景。

再度冲刺IPO

事实上,此次并非海天瑞声首次申请IPO。资料显示,2019年4月该公司申请冲刺IPO,但于7月26日主动撤回申请材料终止其IPO申请。

对此,海天瑞声解释成,考虑公司长远发展的战略布局,鉴于公司发行规模及科创板对战略配售规模的指导,公司或有提前引入优质机构投资者的考虑,股权结构恐发生变化,故主动终止科创板上市申请。

2019年12月,海天瑞声通过增资及少量股权转让引入了中移投资控股有限责任公司、中国互联网投资基金等机构投资者。

目前,中国移动旗下的中移投资控股有限责任公司持股占比12.01%,位列海天瑞声第三大股东;中国互联网投资基金持股占比4.02%位列第九大股东,其背后是中国移动、中国联通、中国人寿保险等股东。


>

2020年2月,该公司再次将上市计划提上日程,其IPO申请已于6月22日获得上交所受理,目前已经进行到问询阶段。

AI算法模型发展和演进的“燃料”

在AI产业链中,算法、算力和数据共同构成AI技术发展的三大核心要素,而机器学习,特别是有监督的深度学习是现阶段实现AI技术的主要路径。

一方面,深度学习可以通过对低层特征的组合,形成更加抽象的高层属性类别,自动从信息中学习有效的特征并进行分类,而无需人为选取特征。凭借自动提取特征、神经网络结构、端到端学习等优势,深度学习在图像和语音领域学习效果最佳。

另一方面,监督学习需要大量训练数据对学习结果进行反馈,能够有效降低算法的错误率。因此,兼具学习效果优异及错误率较低两大优势的有监督深度学习已成为主流的算法架构。

在当前人工智能行业发展进程中,有监督的深度学习算法是推动人工智能技术取得突破性发展的关键技术理论,而大量训练数据的支撑则是有监督的深度学习算法实现的基础,训练数据已成为AI算法模型发展和演进的“燃料”。

AI算法模型从技术理论到应用实践的落地过程依赖于大量的训练数据,2012-2016年期间,人工智能行业不断优化算法增加深度神经网络层级,利用大量的数据集训练提高算法精准性,ImageNet数据集的超过1400万张训练图片和1000余种分类便在其中起到重要作用。

然而,从自然数据源简单收集取得的原料数据并不能直接用于有监督的深度学习算法训练,必须经过专业化的采集、加工,形成相应的工程化训练数据集后才能供深度学习算法等训练使用。

根据Dimensional Research的全球调研报告,72%的受访者认为至少使用超过10万条训练数据进行模型训练,才能保证模型有效性和可靠性,96%的受访者在训练模型的过程中遇到训练数据质量不佳、数量不足、数据标注人员不足等难题。

本文地址:http://www.reviewcode.cn/youxikaifa/165403.html 转载请注明出处!

今日热点资讯