网友提问 :董事长你好!本人刚刚开始研究大模型这个领域,觉得海天作为唯一一家训练数据的上市公司,大有可为。但想先请教个小白的问题,大模型预训练阶段很大程度用的都是无监督学习,而公司过往的数据生产都是服务于有监督学习,请问切换成无监督学习后,公司的业务是否会受影响?谢谢

2023-11-17 15:30:00

海天瑞声 (688787): 回答:尊敬的投资者:您好,大模型是人工智能技术新的发展范式,该技术路线下将衍生出新型数据需求。例如,预训练阶段,数据服务公司需能根据客户的大模型需求,完成对海量数据清洗方案的设计以及执行,通过清洗出高质量数据,帮助客户高效完成模型预训练开发;同时,预训练想要达到更高阶的通用学习效果,需要更为丰富的高质量数据来源,例如各类版权数据等,因此,能聚集更为丰富的版权类数据、并以工程化和规模化地方式向客户提供相应服务的数据服务商将具有更高的市场竞争力。 此外,为使大模型能力更趋近于人类,大模型还将在完成预训练的基础上,通过有监督微调以及基于人类反馈的强化学习,实现模型在特定方向上的优化迭代。上述两个阶段均需深度人工参与,同时参与上述两阶段的数据处理人员将被要求有更高的认知水平和专业能力,以更好指导机器完成高阶能力优化。 大模型时代实质上是一个海量数据的时代,随之将产生海量的数据需求,数据服务模式也将由传统的数据标注向获得海量高质量数据、以及更强的数据处理能力转变,这对数据服务商提出了新的、更高的要求。因此,能够前瞻性布局大模型数据服务能力的服务商将优先获得市场机会,建立先行的护城河。

2023-11-17 15:35:00

热门互动

海天瑞声股票

海天瑞声
法定名称:
北京海天瑞声科技股份有限公司
公司简介:
公司前身为北京海天瑞声科技有限公司,成立于2005年5月11日。
经营范围:
AI训练数据的研发设计、生产及销售业务。
注册地址
北京市海淀区成府路28号4-801
办公地址
北京市海淀区成府路28号4-801

热搜牛散

热门股票

Copyright © 2016 特特股 tetegu.Com All Rights Reserved