昇腾互动查询
关键字
热门互动· · · · · ·
昇腾互动相关· · · · · ·
- 网友提问 :2024年9月2日达晨财智完成对AI基础设施企业——无问芯穹的投资。 2025年2月11日,无问芯穹宣布获七家国产芯片支持,正打通DeepSeek-R1、V3在壁仞、海光、摩尔线程、沐曦、昇腾、燧原、天数智芯等七个硬件平台的多芯片适配优化,现开发者已可以通过Infini-AI异构云平台一键获取DeepSeek系列模型与多元异构国产算力服务。 是否属实
2025-02-11 20:21:04
电广传媒 (000917): 回答 :您好,“新文旅+大资管”是公司战略发展方向和业务发展重点。公司旗下达晨财智管理基金规模近600亿元,基金主要为社会化募集,达晨财智收取一定比例的管理费,并获得基金超额收益分成。目前达晨财智旗下管理的基金累计投资了780余家企业,成功退出301家,主要投资领域包括人工智能、信息技术、生命科技、国防军工等。无问芯穹公司业务情况等建议您咨询无问芯穹公司。谢谢关注。2025-02-14 20:45:12
[ 详细 ] - 网友提问 :问:DeepSeek 实现了大模型训练和推理成本的大幅降低,讯飞星火在大模型训练和推理的软硬件工程化方面有什么样的积累,如何实现对成本的有效控制?
2025-02-13 00:00:00
科大讯飞 (002230): 回答 :答:1、DeepSeek 团队围绕 DeepSeek V3 和 R1 的训练和推理降本,实现了多个有效的软硬件结合深度工程优化创新,包括 MLA(通过低秩矩阵对 KV 矩阵进行压缩显著降低 GPU 显存的消耗)、MTP(通过多帧预测提升数据利用率及训练效果和推理效率)、DualPipe(通过更底层的 PTX 指令优化英伟达 GPU计算和通信的并行)、FP8 混合精度训练(业界首次使用 8Bit 量化浮点数方式实现超大规模模型的训练,以往都是使用 16Bit 量化),最终 DeepSeek 基于 2048张英伟达 H800 卡,约 560 万美元就能完成 V3 模型的一次完整预训练。另外,DeepSeek R1 因为涉及基于大量数据的强化学习迭代训练,其成本未公布。2、和 DeepSeek 类似,科大讯飞受限于有限的算力资源,过去几年关于星火大模型训练和推理成本效率的持续优化也做了大量投入,和 DeepSeek 直接使用英伟达 H800 卡上开展的各种工程优化不同,科大讯飞选择了更难的全国产算力路线。从 2023 年 5 月起科大讯飞就联合华为先后攻克了万卡高速互联组网、计算通信隐藏、训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,将通用大模型、类 o1 的深度推理模型等的训练效率对标 A100 均从最初的 30%-50%优化达到了 85%-95%以上;以 DeepSeek 非常看重的万卡网络通信带宽的利用率为例,DeepSeek 报道的是 93%,而讯飞星火做到了 95%。训练成本也是讯飞星火大模型的竞争优势,我们单次训练成本和 DeepSeek V3 在一个层次,而且后面优化路径也很明确,目前以昇腾 910B 为代表的国产硬件还不支持 FP8 精度训练以及 DualPipe 的实现,随着国产算力在底层能力上进一步提升,讯飞星火的训练成本还有较大的下降空间。3、需要特别说明的是,大模型对算力的需求为训练和推理两个方面,而训练实现的难度远大于推理。这就是虽然陆续有公司宣布可以在国产算力平台上提供 DeepSeek 在内等大模型的推理服务,但仍只有讯飞星火一家是训练和推理均在国产算力上进行的,并且仅用 1 万张 910B 国产算力卡,科大讯飞不仅用比友商少一个数量级的算力取得了大模型研发上的第一梯队成果,而且做了大量国产算力平台上的无人区的适配和效率优化,追求国产算力的极致效率,这比在英伟达上的实现更需要技术实力和战略勇气。2025-02-13 00:00:00
[ 详细 ] - 网友提问 :问:DeepSeek 在 2025 年 1 月 20 日发布的 R1 快速对标 OpenAI 的 o1 大模型,公司在对应的深度推理技术创新上目前处于什么阶段?
2025-02-13 00:00:00
科大讯飞 (002230): 回答 :答:1、DeepSeek 模型从基本理论框架来看,还是 Transformer 和强化学习等深度神经网络理论,训练算力设施还是基于英伟达的 A800 和 H800,但其在工程优化上实现了出色的率先突破。2、DeepSeek R1 快速对标 o1 的主要创新是其提出并实现的 R1-Zero 强化学习训练方案,即直接在 DeepSeek-V3-base 预训练模型上进行大规模强化学习训练,可在数学、代码等推理任务上得到接近 o1 模型的效果,而不依赖任何有监督微调(SFT),这是当前国内外公开已知的、在大规模任务上获得成功效果的首个发布成果,之前学术界已有相关研究,但因为预训练基座模型不够好而使得强化学习的收益不好,这一成果具有较强的创新性,大大减少了数学、代码等任务训练对人工标注推理过程数据的需求。3、DeepSeek R1 并不是唯一高水平的国产深度推理大模型。2024 年 9 月OpenAI o1-preview 发布以后,国内技术领先的大模型厂商也在快速跟进。例如,科大讯飞基于此前在评语模型、强化学习方面的积累,在 2024 年 10 月就实现了蒙特卡洛树搜索(MCTS)等算法创新并跑通了深度推理模型训练算法,因为只能使用国产算力,我们额外花费 2 个月完成华为昇腾 910B 算力的适配和优化并大幅提升训练效率(训练效率相比 A100 从 55%提升到 85%),于今年 1 月 15日完成了星火深度推理模型 X1 的训练和发布。虽然当前 X1 模型很小(仅 130亿参数),但依靠我们算法和数据优势,星火 X1 已达到可以和 OpenAI o1-preview对标的水平;随着国产算力的逐步到位,模型参数增加后,我们完全有信心实现数学答题和过程思维链能力全面对标甚至超过 OpenAI o1。此外,结合与中国教科院等诸多教育专家的合作成果,我们将使得 X1 的思维链结果更加符合教育教学的专业要求,在教育、医疗等领域实现更大的应用赋能价值。2025-02-13 00:00:00
[ 详细 ] - 网友提问 :公司和华为昇腾有哪些合作?
2025-02-10 13:46:06
亚康股份 (301085): 回答 :尊敬的投资者您好,公司对搭载昇腾芯片的算力设备进行集成销售、交付部署、适配调优等服务。公司控股子公司亚康华创推出搭载昇腾芯片、DeepSeek平台的桌面级智能一体机——D-BOX Pro,以满足初级企业级客户向AI转型的需求。目前该一体机正处于市场推广初期,尚未产生相关收入,相信随着AI应用的增长,未来会对公司主营业务带来积极影响。感谢您的关注。2025-02-13 20:45:12
[ 详细 ] - 网友提问 :1、算力方面,公司有哪些布局?请介绍一下广电五舟的业务情况?
2025-02-12 00:00:00
广电运通 (002152): 回答 :答:1、公司围绕“四云两中心”开展自主研发,打造广州政务信创云、公安信创云、国资国企云、AI 智算云等专属云服务,推进云数据中心和算力中心建设。公司承建了广州人工智能公共算力中心一期项目(金额3.67 亿元),已于2022年下半年投入使用,主要面向广州政府机构、科研院所、高校和企业提供AI算力、应用创新、产业赋能、科研合作、人才培养等服务。2023 年年底,公司中选了广州人工智能公共算力中心二期项目(金额4.73 亿元),在一期基础上扩容。此外,公司现在的总部科学城产业园将改造为数据产业园,重点推进公司算力及数据的发展。2、公司 2021 年入股广电五舟,成为其第一大股东,并通过资源共享,深度赋能,推动广电五舟成为华为鲲鹏、昇腾的战略合作伙伴之一,为客户提供国产高性能计算产品及各种算力解决方案,产品及解决方案逐渐从党政领域拓展至金融、交通、医疗、教育、气象、工业制造等多个行业及领域。受益于国产算力需求的拉动,服务器业务实现高速增长。广电五舟2023 年实现营业收入12.98 亿元,同比增长 133%,2024 年上半年实现营业收入8.58 亿元,同比增长74%,整体发展态势良好,处于快速增长期。2024 年8 月,公司实现控股广电五舟,将其纳入公司合并报表范围。公司将充分发挥与广电五舟在技术研发、产品和市场方面的协同效应,不断推动业务拓展和技术创新,助力各行各业加速数字化转型,推动公司算力板块的发展壮大。2025-02-12 00:00:00
[ 详细 ] - 网友提问 :请问公司与DeepSeek有合作吗?另外再问一下公司与华为合作的AI成果如何?
2025-01-27 16:14:48
东方国信 (300166): 回答 :您好,感谢您的关注。DeepSeek的问题请参见类似问题的回复。 公司自主研发的AI深度学习应用层产品,与华为昇思、鸿蒙完成兼容认证,性能进一步提升,可高度满足客户需求。同时完成模型从 cuda 向 cann 的迁移,协助中国移动等客户构建基于昇腾的大模型训推平台。未来将进一步深化社区合作,推动项目、产品生根发芽,通过更专业、更高效地合作共同推进行业应用落地。谢谢!2025-02-13 11:45:12
[ 详细 ] - 网友提问 :请问君逸数码,华鲲振宇是华为“鲲鹏&昇腾”唯一双战略合作伙伴,那么想问问君逸数码和华鲲振宇是否已经开展合作了?谢谢回答
2025-02-01 14:33:43
君逸数码 (301172): 回答 :您好!君逸数码与华鲲振宇结成了战略合作关系,合作研发基于“鲲鹏+昇腾”技术的智慧城市高性能计算平台,旨在为智慧城市提供强大的算力支持。这一平台将结合华鲲振宇在硬件(如鲲鹏处理器、昇腾AI芯片)和君逸数码在智慧城市领域的行业产品及经验,推动城市大脑、城市生命线等核心场景的智能化升级。如有重大事项公司将严格按照信息披露规则履行信息披露义务,具体请以公司披露的公告为准。敬请广大投资者注意投资风险。感谢您的关注。2025-02-13 11:45:12
[ 详细 ] - 网友提问 :请问贵公司的大模型算力是华为昇腾提供的还是贵公司有自己的算力数据处理中心?
2025-02-07 15:43:00
- 网友提问 :新华财经上海2月5日电(记者高少华)报道,国内多家GPU企业纷纷宣布支持DeepSeek,正加速完成国产GPU与DeepSeek的适配。贵公司为什么一点反应该都没有?春节都放大假了吗?看看人家华为:2月5日,华为发布多个与DeepSeek相关的最新消息。2月4日,DeepSeek系列新模型正式上线昇腾社区。此外,基于原生鸿蒙操作系统的小艺助手App已经接入DeepSeek。
2025-02-06 01:43:25
景嘉微 (300474): 回答 :您好,公司产品JM系列、景宏系列已完成DeepSeek R1系列模型适配。但受市场需求、用户体验、技术进步和政策变化等因素的影响,与DeepSeek相关的业务效果尚存在不确定性,暂不会对公司业绩造成重大影响,请投资者注意投资风险。感谢您的关注!2025-02-12 17:18:39
[ 详细 ] - 网友提问 :1、DeepSeek 大模型对于公司的影响?
2025-02-12 00:00:00
亚康股份 (301085): 回答 :DeepSeek 在语言处理、深度学习、大数据分析、知识图谱、边缘计算与云计算结合等方面拥有强大、高效的能力,大大降低了 AI 应用的门槛,必然为国内 AI 市场注入新动能,能够推动AI 行业和科技行业的发展。公司控股子公司北京亚康华创科技有限公司联合北京昇腾创新人工智能有限公司、北京维视智能科技有限公司,发布了搭载昇腾芯片、DeepSeek 系列模型的桌面级智能一体机--D-BOXPro,具有设备轻量化、本地化快速部署、扩展性强等优点,能够满足个人及中小企业对于 AI 的需求。该一体机作为初代产品,后续将会进行持续迭代与性能优化,目前正处于市场推广初期,尚未产生相关收入,相信随着 AI 应用的增长,未来会对公司主营业务带来积极影响。2025-02-12 00:00:00
[ 详细 ]