{{ v.name }}
{{ v.cls }}类
{{ v.price }} ¥{{ v.price }}
8月15日,Meta AI 的研究者提出了一种新的方法,称为指令回译(instruction backtranslation),该方法通过自动注释相应的指令来构建高质量的指令跟随语言模型。该研究从一个语言模型开始,并作为种子模型,该模型在少量的种子数据以及 web 语料库上进行了微调。种子模型的作用是用来构建训练样本,然后这些样本中的一些高质量样本将会被筛选出来,接着,这些数据被用来微调一个更强大的模型。经过两轮迭代的数据集对 LLaMa 进行微调,所产生的模型 Humpback 在 Alpaca 排行榜上优于其他现有的非蒸馏模型,如 LIMA、Claude、Guanaco 等。
8月15日,讯飞星火认知大模型V2.0升级发布会召开,宣布升级代码能力和多模态能力。同时发布并升级搭载讯飞星火认知大模型V2.0能力的多项应用和产品,包括智能编程助手iFlyCode1.0、视频创作工具讯飞智作2.0、教学活动设计助手星火教师助手以及口语练习工具星火语伴2.0等。此外,科大讯飞还与华为联合推出讯飞星火一体机,为企业提供专属的大模型,打造全国产化算力底座。另外,OpenAI宣布基于GPT-4开发出一种内容审核解决方案,最新的GPT-4人工智能模型可以帮助企业在一天左右的时间内完成六个月的内容审核工作,加速处理繁重任务,提高社交媒体公司的工作效率。同时,OpenAI的首席执行官萨姆·奥特曼(Sam Altman)表示,公司没有使用用户生成的数据来训练人工智能模型。
小米在2023年雷军年度演讲上宣布,小爱同学将接入生成式大模型。官方演示视频展示了大模型下小爱同学的功能性提升,包括智能问答、文案创作和图片生成等能力。此外,新的小爱同学还能够实现实时摘要和翻译功能,适用于会议等场景。
8月15日,Meta AI发布了MyoSuite2.0系列,这是一个与加拿大麦吉尔大学、美国东北大学和荷兰特文特大学的研究人员合作的新项目。该项目旨在利用机器学习应用于生物力学控制问题,以展示人类水平的灵巧和敏捷性。该团队迄今为止创建了最复杂的手臂和腿部模型,协调大型和小型肌肉群是一个具有挑战性的控制问题。MyoSuite2.0平台提供了一系列的基线肌骨模型和开源基准任务,供研究人员进行尝试和探索。
百度在深度学习开发者大会上宣布,文心一言新增了五个原生插件:百度搜索、览卷文档、E言易图、说图解画和一镜流影。这些插件的加入扩展了大模型的能力边界,使其更适应不同场景的需求。
据消息,OpenAI宣布收购Global Illumination。Global Illumination是一家成立于2021年的纽约公司,由Thomas Dimson、Taylor Gordon和Joey Flynn创立,利用人工智能开发创意工具、基础设施和数字体验。尽管OpenAI没有透露具体的收购条款,但声明中表示,Global Illumination的整个团队已加入该公司,参与包括ChatGPT在内的核心产品的开发。此外,OpenAI还宣布将使用新一代大型语言模型GPT-4进行内容策略开发和内容审核决策。这将有助于实现更一致的标签、更快的策略优化反馈闭环以及减少人工审核人员的参与。
美国能源部宣布将投入1600万美元用于支持15个核物理领域的AI项目。这些项目旨在利用人工智能和机器学习技术加速核物理研究中的科学发现。通过使用AI工具和方法进行实验、模拟、理论和加速器操作,这些项目将扩展和加速科学研究的影响。这15个项目将由能源部的8个国家实验室和22所大学的核物理研究人员共同参与。其中包括开发深度学习算法,以识别稀有核衰变中的基本对称物理学信号,如果观测到这种信号,将有助于证实宇宙可能主要由物质而非反物质组成。
字节跳动推出了首个大模型独立APP——AI对话产品“豆包”,该应用目前可在官网直接注册使用或通过官网提供的二维码下载。豆包APP是字节跳动内部代号为“Grace”的AI项目,拥有文生文、文生图的功能。豆包APP提供以AI对话为核心功能的技术服务,接入了利用深度神经网络、强化学习等技术训练的大规模语言模型以及其他模型及服务,用户输入指令后可以生成参考信息。
另外,谷歌最后一位Transformer论文作者Llion Jones离职创业,与谷歌日本AI研究部门的前负责人David Ha共同创立Sakana AI。他们的目标是打造基于自然启发式智能的新型AI基础模型,解决AI系统成本和安全性等问题。Sakana AI计划使用数量巨大的小模型进行协作解决问题,希望构建人工智能来解决这些问题。
此外,快手公布最新进展——“快手AI对话”功能已经在安卓版本开放内测。快手AI对话是对搜索新场景的探索,将快手站内大量的内容资源作为索引,提升回答准确性,并满足用户多元化需求。用户可以进行追问,在个性化的场景中寻找到更适合自己的搜索结果。
联想发布了两款全新的AI服务器产品,分别是联想问天WA7780 G3 AI大模型训练服务器和联想问天WA5480 G3 AI训推一体服务器。这两款服务器是专门为AI导向打造的,能够助力构建更加绿色高效的人工智能数据中心,满足客户从训练到推理等多样的算力需求。其中,联想问天WA7780 G3是一款专为AI大模型训练而设计的服务器,而联想问天WA5480 G3 AI训推一体服务器则是联想问天品牌中的4U机架式AI服务器,支持多元的算力和丰富的生态。
另外,美国联邦地区法院法官贝里尔・A・豪威尔裁定,由AI生成的艺术品无法获得版权保护。在审理了一起针对美国版权局的诉讼后,原告斯蒂芬・塞勒使用他创造的创造力机器算法制作了一幅AI生成的图像,但被版权局拒绝了授予其版权的申请。
此外,据消息报道,MIT推出了一款拾物机器人,该机器人能够通过自然语言进行控制,并且能够拾取从未见过的物体。研究人员将2D特征嵌入了三维空间,构建出了用于控制机器人的特征场(F3RM)。这样,即使在2D图像中构建的图像特征和语义数据也能被三维机器人理解并使用。这款机器人不仅操作简单,而且在训练过程中需要的样本量也很小,低训练样本就能实现轻松取物。除了拾取问题,还可以让机器人把拾到的东西放到指定位置。团队提供了完整的、未经筛选的实验结果,他们在实验室周边随机选取了out-of-distribution测试样本进行了测试。其中,使用CLIP ResNet特征的特征场在三成以上的测试样本中(78%)成功抓取和放置。基于开放性人工语言指令的任务上,成功率在60%左右。