Meta称其LLaMA 语言模型比OpenAI 的 GPT-3更有前景

天天见闻 天天见闻 2023-02-28 科技 阅读: 124
摘要:   在OpenAI推出大型语言模型ChatGPT后,Meta也上线了一个新模型LLaMA。该模型只对研究人员开放。因为它是为无法访问大量基础设施的研究社区构建的。这使得研究人员更容易针对特定任务微调模型。  LLaMA不仅仅是使用英语文本构建的。Meta使用20种使用拉丁语或西里尔语脚本的语言训练其模型。对当前大型语言模型的访问受到限制。

  在OpenAI推出大型语言模型ChatGPT后,竞争对手纷纷迎头赶上。谷歌有 Bard,微软有新必应。现在,Meta也上线了一个新模型LLaMA。目前,该模型只对研究人员开放。

  据了解,LLaMA是 Large Language Model Meta AI 的首字母缩写词,比现有的模型更小,因为它是为无法访问大量基础设施的研究社区构建的。LLaMA 有多种尺寸,从70亿个参数到650亿个参数不等。

  Meta方面称,尽管 LLaMA-13B 的尺寸较小,而且少了1620亿个参数,但“在大多数基准测试中”表现优于 OpenAI 的GPT-3。

  据报道,最大的模型 LLaMA-65B 与 DeepMind 的Chinchilla70B和PaLM-540B等模型可相提并论。

  LLaMA 是一个基础模型:它在大量未标记数据上进行训练,这使得研究人员更容易针对特定任务微调模型。由于模型更小,因此更容易针对用例进行再训练。

  LLaMA不仅仅是使用英语文本构建的。Meta使用20种使用拉丁语或西里尔语脚本的语言训练其模型。然而,大多数训练数据都是英语,因此模型性能更好。

  Meta 的研究人员声称,由于模型的大小,对当前大型语言模型的访问受到限制。

  Meta 认为“这种受限访问限制了研究人员理解这些大型语言模型如何工作以及为何工作的能力,阻碍了提高其稳健性和解决已知问题(例如偏见、侮辱和产生错误信息的可能性)的努力”。

  除了使模型更小之外,Meta 还试图让 LLaMA 更易于访问,包括在非商业许可下发布它。

  对各种 LLaMA 模型的访问权限只会根据具体情况授予学术研究人员,例如隶属于政府、民间组织和学术界的研究人员。

  与 ChatGPT 一样,LLaMA 与其他语言模型一样存在生成有偏见或不准确的信息。Meta 的 LLaMA 声明承认了这一点,并表示通过共享模型,研究人员可以“更轻松地测试新方法来限制或消除大型语言模型中的这些问题。”

  Meta在去年5月曾推出一款面向研究人员的名为OPT-175B的大型语言模型,去年年底还发布过另一款模型Galactica,但后者被发现经常分享有偏见或不准确的信息,在48小时内被迅速下架。

其他相关
Meta全新自研AI芯片曝光:性能相比MTIA v1提升了3倍!

Meta全新自研AI芯片曝光:性能相比MTIA v1提升了3倍!

作者: 天天见闻 时间:2024-04-12 阅读: 1
4月11日消息,在英特尔、谷歌相继推出最新的AI芯片之后,Meta于当地时间10日也公布了全新的自研AI芯片“下一代MTIA”(Next Gen MTIA)。...
华为发首款纯电轿车,恒大海花岛1.67万户拿证,OpenAI再甩王炸|一周产业热点

华为发首款纯电轿车,恒大海花岛1.67万户拿证,OpenAI再甩王炸|一周产业热点

作者: 天天见闻 时间:2023-11-16 阅读: 55
产业每周都是热点,旨在盘点产业热点话题,探索产业信息信息,囊括行业大事件以及专业权威财经和科技领域的创作者。 今日(11月10日)看点: OpenAI发布GPT-4Turbo 华为首款纯电动乘用车智界S7 第六届世博会年度别成交总额784.1亿美元 何小鹏余承东“AEB之争”握手与 恒大海南海花岛已有1.67万户家庭取得产权证 OpenAI召开首届开发者大会,GPT-4Turbo...

OpenAI欲打造AI行业的“苹果生态”?上线GPT Store,定制个人GPT成为现实,重磅更新GPT-4,API价格下调近3倍

作者: 天天见闻 时间:2023-11-07 阅读: 56
每位记者:文巧每编辑:李孟林 在发布会时间,OpenAI再次轻松颠覆了整个人工智能(AI)行业。不仅是AI领域,对于受AI影响的各行各业来说,昨晚可能是睡不着的一夜。 当地时间11月6日,OpenAI举办首届开发者大会OpenAI DevDay,该公司CEO Sam Altman发布ChatGPT重大更新--定制版本ChatGPT,用户可打造自己的GPT,向GPT Store公开分享,同时发布更强大、速度更快的GPT-4版本GPT-4Turbo。更令人惊讶的是,OpenAI将API的价格下调了近3倍,降至1000Token/美分。...
ChatGPT不再光是“吞金巨兽”:OpenAI有望实现10亿美元年收入

ChatGPT不再光是“吞金巨兽”:OpenAI有望实现10亿美元年收入

作者: 天天见闻 时间:2023-08-30 阅读: 64
据财联社8月30日报道,随着企业开始采用ChatGPT背后的技术,OpenAI公司有望在未来一年实现10亿美元的年收入。 OpenAI被认为是处于生成性人工智能前端的几家公司之一。自去年11月推出聊天机器人ChatGPT以来,OpenAI的合作伙伴已经扩大,包括从初创公司到大型科技公司,这些公司希望将这项技术融入他们的业务和产品中。 未命名的人士称,微软支持的人工智能初创公司月收入约8000万美元。 ...
周鸿祎:OpenAI之路不一定完全适合所有企业的发展

周鸿祎:OpenAI之路不一定完全适合所有企业的发展

作者: 天天见闻 时间:2023-08-26 阅读: 86
2023年亚布里论坛夏季峰会于8月24日-27日在深圳举行。360集团创始人兼董事长周鸿鑫出席并发表演讲。 周鸿在演讲中说,OpenAI的道路不一定完全适合所有企业的发展,只要企业真的使用OpenAI的ChatGPT,就会发现有很多问题。...
开源暴打收费生态?Meta将推出“免费版编程工具”,剑指OpenAI

开源暴打收费生态?Meta将推出“免费版编程工具”,剑指OpenAI

作者: 天天见闻 时间:2023-08-19 阅读: 74
来源:华尔街见闻 Meta最早将于下周推出开源AI软件,旨在帮助开发者自动生成编程代码,是继Llama两大语言模型之后可能颠覆人工智能领域的大胆举措。 Meta最快下周将宣布对OpenAI的另一场“暴打”。 据两位直接知情人士透露,Meta最早将在下周推出一款软件,帮助开发者自动生成编程代码。这款开源的编程人工智能模型名为Code Llama,直接挑战OpenAI、谷歌和其他公司的付费专有软件。 Code Llama将“暴力对标”OpenAI旗下的Codex模型,比Meta的开源大语言模型Llama2显著增强。Code Llama的开源属性使得企业用户更容易开发AI助手,后者在开发者键输入时自动推荐代码,可与Codex支持的Microsoft GitHub Copilot等付费编程辅助工具争夺客户端。...
我来说两句

年度爆文