2023年7月8日9:00-12:00
地点:上海世博中心430会议室
领域:技术创新-金融科技
华泰证券作为证券业内的科技先行者,致力于打造多方参与的科技创新生态。7月8日上午,华泰证券将在2023年世界人工智能大会举办“AI大模型的金融数智化机遇”科技金融创新论坛。此次论坛不仅有从事情感计算的知名学者来聊一聊人工智能的“理智”与“情感”,前瞻AI大模型技术的发展趋势,还将邀请产业专家、投资专家碰撞大模型技术的在包括金融等产业的应用前景以及投资机遇。
华泰证券研究所TMT团队也将在本次论坛上发布AI大报告,展望AI大模型时代的产业机遇。以下为报告部分内容摘要。更多精彩讨论,敬请关注华泰证券科技金融创新论坛,欢迎线下参会或收看线上直播!
AI大模型企业是如何炼成的AI大模型是一个资本密集,人才密集和数据密集的产业,如何形成“数据-模型-应用”的飞轮,是大模型企业成功的关键。通过深度复盘海外基础大模型企业,梳理各公司的资源禀赋和路径选择,我们看到:1)微软&OpenAI对颠覆式创新的持续投入是当前领先的深层原因;2)谷歌有深厚的人才和技术积累,但管理架构上未形成合力;3)英伟达通过CUDA框架,形成了其它芯片公司难以逾越的护城河;4)Meta等正通过模型开源进行反击。当前,国内百度、阿里、商汤、华为等积极加入,行业呈现“百模大战”的竞争格局,是否能形成飞轮是最后胜出的关键。
中国如何解决AI算力瓶颈问题
算力是制约中国发展以ChatGPT为代表的大模型主要瓶颈之一。据OpenAI,大模型训练所需算力每3-4个月增长1倍,增速远超摩尔定律(18-24个月/倍)。随着GPT-4等下一代大模型出现,算力需求还有望进一步大幅增长。我们认为美国对华出口限制,主要造成中国先进工艺发展短期受限、国产替代方案或推高大模型训练成本/时间两大影响。中国发展高性能计算,应加大在:1)异构计算芯片架构;2)先进封装方面的投入。
从BloombergGPT看金融GPT机遇
以GPT-3、GPT-4为代表的大语言模型均由大型的专业人工智能团队开发,并且模型训练需要大量算力。BloombergGPT的成功证明了“开源模型+高质量垂直数据”的方案,可以基于垂直领域数据打造同样具有竞争力的大语言模型。大量的高质量垂直领域知识有望弥补模型在规模上的不足,对比BloombergGPT与GPT-3可以看到,尽管BloombergGPT的模型参数相较于GPT-3较小,但得益于BloombergGPT的预训练数据增加了大量的高质量金融数据,并对预训练数据进行了一系列的清洗、标注,BloombergGPT在通用能力与GPT-3基本持平的情况下,实现了金融垂直能力的大幅增强。
从国内的金融GPT的预期来看,金融IT厂商掌握着丰富的金融垂直知识与现有AI产品布局,基于高质量的金融数据与开源的大语言模型,同样有机会打造专属金融场景的大语言模型,实现大语言模型在金融场景的有效赋能,让大语言模型成为底层的AI操作系统。