财联社3月31日讯(编辑 牛占林)当地时间周四稍晚,彭博社发布了专门为金融领域打造的大型语言模型(LLM)——BloombergGPT,引发投资者关注,这将对金融市场产生何种影响?

彭博社是全球最大的财经资讯公司,在公司成立的40年的时间里,收集了海量的金融市场数据,拥有广泛的金融数据档案,涵盖一系列的主题。使用该公司数据终端的客户遍布全球,包括交易员、投行、美联储、美国其他官方机构以及全球各大央行等。

基于LLM的生成式人工智能(AI)已经在许多领域展示了令人兴奋的新应用场景,但是,金融领域的复杂性和独特的术语意味着可能需要特定的语言模型,拥有巨大优势的彭博自然不甘落后,于是开发了拥有500亿参数的语言模型BloombergGPT。


(相关资料图)

据彭博社发布的报告显示,BloombergGPT已经接受了广泛的金融数据的训练,以支持金融行业内各种各样的自然语言处理(NLP)任务。它是专门为金融领域开发的一种语言模型,可以更好地处理金融领域的数据和任务。

报告指出,研究人员利用彭博社现有的数据,对资源进行创建、收集和整理,通过构建迄今为止最大的特定领域数据集来完成BloomberGPT,并基于通用和金融业务的场景进行混合模型训练。

作用与优势

彭博声称,BloombergGPT将协助彭博改进现有的金融NLP任务,如情感分析、命名实体识别、新闻分类和问答等。

此外,BloombergGPT将为整合彭博终端上的大量数据提供新机会,以更好地帮助公司的客户,同时将AI的全部潜力带入金融领域。

报告显示,该模型依托彭博社的大量金融数据源,构建了一个3630亿个标签的数据集,支持金融行业内的各类任务。

与此同时,该数据集还与一个3450亿标签的公共数据集结合,创建了一个包含超过7000亿标签的大型训练语料库。

这使得该模型不仅在金融任务上的表现远超过现有模型,且在通用场景上的表现与现有模型也能一较高下。

彭博首席技术官Shawn Edwards表示:“我们认为具有金融领域特点的大型生成性LLM具有巨大价值,原因有很多——少量样本学习、文本生成、对话系统等。我们很高兴能开发出第一个专注于金融领域的LLM。BloombergGPT将使我们能够解决许多新类型的应用,同时它的性能优于为每个应用定制的模型,且上市时间更快。”

彭博机器学习产品和研究团队负责人Gideon Mann解释说:“机器学习和NLP模型的质量取决于你输入的数据。得益于彭博40年间积累的金融文件,我们得以精心打造一个大型、干净、特定领域的数据集来训练一个最适合金融用途的LLM。我们很高兴能够利用BloombergGPT改进现有的NLP工作流程,同时也思考新的方法将这个模型投入使用,为我们的客户带来惊喜。”

关键词: