“商汤们”托举AI大时代丨2023数字中国年度案例

　　AI时代在2023年正式拉开了序幕。

　　根据Markets and Markets数据，2023年全球AI市场规模为1502亿美元，预计2023年至2030年复合增长率为36.8%。

　　托举起这个AI大时代不断向前的，是那些脚踏实地的企业——它们坚持长期主义，深深地扎根于产业土壤，关注生产力的创新与颠覆式增长，持续探索、试错与实践，埋下时代变革的种子，并向阳而长。

　　商汤（00020.HK）正是其中最典型的一家。

　　2023年是商汤成立的第九年。对AI大时代的畅想与厉兵，坚实了商汤发展思路——踏实打基础，落地找应用——一方面，商汤通过打造新型AI基础设施“商汤AI大装置SenseCore”，打通算力、算法和平台；另一方面，商汤建立“日日新SenseNova”大模型及研发体系，以低成本解锁通用AI能力，推动AI创新和落地，打通商业价值闭环，解决长尾应用问题。

　　AI时代已至

　　全球顶尖科技巨头都在不遗余力地拥抱这个AI大时代。

　　就在11月初，马斯克发布了他新创办的 AI 公司 xAI 的首款产品 Grok，这是一款对标 ChatGPT 的聊天机器人，马斯克由此真正进入了生成式 AI 这条目前最热门的赛道，与 OpenAI、谷歌、Meta 同台竞技。

　　苹果据悉今明两年将豪掷数十亿美元采购AI服务器，力图追赶微软和谷歌的领先地位。此外，苹果计划最早在2024年年底将生成式AI技术融入iPhone和iPad，端侧AI应用落地接近转折点。

　　成立48年的微软借力OpenAI正重新成为全球最领先的科技公司。微软坚信下一代AI将重塑每个软件类别和每个业务，包括微软自己的业务。CEO萨蒂亚•纳德拉在10月致公司股东的年度信中写到，非常看好AI，未来继续大力押注。

　　国内大厂也正在扑面而来的AI大潮中迎头赶上。仅仅是类ChatGPT技术方面，各大科技公司年内已推出的大模型数量超180个，还有数十个在研。赛迪顾问数据显示，今年1-7月，中国大模型发布量占全球比重达67.4%。

　　除了数量的爆发式增长，大模型的参数也在增长。GPT-2的预训练数据量为40GB、参数量仅有15亿个，GPT-3的预训练数据量达到45TB、参数量更是高达1750亿个，GPT-4则据称为1.8万亿参数量，13万亿训练数据。而目前的多模态大模型参数量普遍相对较大，多在千亿级以上。

　　随着企业数据的不断积累，算力基础设施不断完善，未来大模型的商业应用场景将越来越多，大模型赋能千行百业，中国AI市场规模也将持续扩大。赛迪顾问预计，2025年中国AI产业规模将超3000亿元，未来三年产业规模年均复合增长率达到18.8%。

　　商汤的AI理念

　　身处这个正被AI深刻改变的时代，商汤有着自己的发展理念。

　　AI的发展，需要大算力底座，需要基础设施，也需要能够结合产业应用落地。商汤坚持——先打基础，再找应用。

　　商汤意识到，当前业界训练大模型，对大算力的需求非常旺盛，而真正好用的基础设施却十分稀缺。因此，商汤打造了新型人工智能基础设施——商汤大装置SenseCore，打通算力、算法和平台。

　　据悉，大装置SenseCore拥有超30000张GPU，融合了AI、超算与大数据的核心能力，通过为AI优化的高性能计算、高性能存储及缓存、高性能网络，以存算分离、大规模弹性、容错调度等特征，支撑大模型在数千张卡、PB级存储上，完成万亿级参数大模型训练。

　　SenseCore AI平台产品则提供了模块化、全链条的数据、训练及推理能力，可实现百亿级数据管理及检索、人工标注服务，加速AI大模型研发效率。一键量化、一键部署、一键应用，提供了大模型快速上线验证的工具，加速创新。

　　“商汤大装置既是算力平台，也是数据型服务平台。未来技术发展当中，如果没有这样一个基础设施平台，创新科技几乎是不可能的。”商汤科技董事长兼CEO徐立表示。

　　目前，商汤大装置已累计服务超50个核心客户，其中大模型客户10家以上，涵盖智能驾驶、生物制药、芯片设计、智慧商业、高校科研等前沿领域，已在超过20个落地场景中实现大模型交付。

　　在大装置基础上，商汤构建了“商汤日日新SenseNova”大模型体系。

　　日日新SenseNova是国内首个综合能力超越GPT-3.5的大语言模型及文生图大模型，已服务上千家客户，模型相关业务规模已增长6倍。

　　“我们以商汤AI大装置SenseCore打造AGI（通用人工智能）时代的基础设施，并基于此将大模型体系命名为‘日日新’，寓意‘苟日新、日日新、又日新’，希望在模型迭代速度及处理问题的能力上可以日日更新，不断解锁AGI的更多可能。”徐立称。

　　基于“商汤日日新SenseNova”大模型体系，商汤针对不同细分场景打造了系列生成式AI大模型应用，包括大语言模型应用商量SenseChat、图像生成平台秒画SenseMirage、数字人视频内容创作平台如影SenseAvatar、大场景3D内容生成平台琼宇SenseSpace、物体重建及营销服务平台格物SenseThings。

　　“目前的人工智能就是一门实践科学，训练一个大模型如同教育一个小孩，‘课程设计’是其中的关键。”徐立表示，商汤会专注于“课程设计”和高价值数据的构造，结合不同领域的Knowhow可以快速训练适用于行业的专用模型，实现行业落地。

　　商汤科技已将AI商业化赋能多个行业。在“商汤日日新SenseNova”大模型体系下，商汤正积极通过大模型的多模态能力组合赋能产业升级，并带来诸多引领行业的应用创新。

　　商汤凭什么？

　　数据、算力和算法是AI最底层的三大要素，亦是决定AI发展的重要基础。支撑商汤发展战略的，也是其自身在三要素领域独特的优势。

　　算法类似于AI模型的大脑，目前我国在AI算法基础理论研究方面与海外的差距已经缩小，同时由于AI算法的革新频率较快，未来在某些垂直领域的进展可能更为领先。

　　商汤很早开始探索计算机视觉领域，2017年布局决策智能，2019年开始涉足NLP（自然语言处理）领域，为大模型的研发和后续应用打下了坚实的算法基础。

　　另一方面，算法的本质是人才的力量。目前，商汤已组建成亚洲最大、水平最高的AI研究团队，核心团队具有20年的科研经验，不断探索最前沿的人工智能研究。截至2022年末，商汤研发队伍高达三千多人，占员工总数近70%，全年研发支出超40亿元。

　　算力为AI模型提供运行动力，没有足够的算力，AI模型就无法顺利进行训练、推理和应用。面对高速增长的算力需求，GPU等高性能算力资源紧缺是目前制约人工智能发展的主要因素之一。

　　商汤位于上海临港的人工智能计算中心（AIDC）2022年初正式启动运营，目前能够输出超过6000 Petaflops超大规模算力，拥有行业领先的算力输出能力、超大模型训练及大规模推理能力，是亚洲最大的智能计算平台之一。

　　近期，商汤位于重庆的人工智能计算中心正式“点亮”。据悉，商汤重庆AIDC首期建设以国产化算力为主，中长期规划建设算力1000 Petaflops。

　　数据的累积下沉和打通是一切人工智能模型运行和应用的基础，AI模型训练需要大量高质量数据作支撑，大模型的价值观和安全性也依赖于训练数据质量。

　　商汤在AI数据方面的优势源于其积累的原始语料数据体量已经非常大，而更加有壁垒的其实是提高数据的质量。

　　为提高数据质量，商汤投入了数百台服务器，搭载了千卡级的GPU计算资源，同时靠算法结合人工标注的方式，对原始语料数据做分门别类的精细化清洗。

　　“我们训练了大量的分类器，可以按照要求筛选出高价值的数据，也对一些特定类别数据进行了大量的人工标注。”商汤科技告诉第一财经，“商汤关注训练数据的每一个细节，确保其质量、安全性和价值观都符合要求。”

　　作者：冯丽君

（责任编辑：韩艺嘉）