王晶校友来访,畅谈大模型发展
王晶校友来访,畅谈大模型发展
文| 768号队员 张子陆
2024年3月7日下午2点半,AI领域的资深前辈、校友王晶来到团队为我们带来了题为《大模型:从理论到实践》的讲座,为我们分享与探讨AI大模型的机遇和发展。
王晶,创业者,前谷歌大脑成员,在人工智能领域有丰富的研究和创业经验,目前在筹备大模型和个性化结合的新创业方向。2022年创办Storytell.ai,利用大模型为知识工作者提能增效。2014至2019年先后于谷歌广告和谷歌大脑部门负责机器学习和人工智能项目研发,针对谷歌广告机器学习系统和YouTube推荐系统提出了二十多项大型算法,带来每年超过两亿美元的收益。
讲座上,以大模型的发展为序,分别介绍了大模型的诞生、爆发性增长、应用3个阶段的核心技术与情况。首先,王晶校友以谷歌翻译为引子,为我们介绍了翻译问题中的核心技术,可以追溯到Seq2Seq模型,但由于Seq2Seq模型在处理长序列模型的局限性,王晶校友又我们介绍了以自注意力机制为基础的Transformer模型。然后,王晶校友为我们介绍了OpenAI公司开发的GPT、Meta公司开发的RAG,并为我们讲述了其中核心的原理。最后,王晶校友为我们介绍了大模型的应用和未来展望,未来,随着软硬件的发展,大模型将会在更多领域展现巨大的潜力和应用前景。
图1 王晶校友讲解大模型的发展
王晶校友的讲座引发了团队师生的广泛思考。曹洋老师、黑晓军老师,以及参会的同学们对王晶校友的内容提出了自己的思考和疑问。王晶校友针对这些问题讲述了自己的见解,并详细解答了大家提出的问题。讲座以十分融洽的氛围来到了尾声。
讲座之后,接待组王之义同学为王晶校友详细介绍了团队发展历程、团队文化以及各个项目组的总体情况,王晶校友对团队的发展表示了赞许。