OpenAI-GPT-4技术报告 (中文版与英文版)
本技术报告介绍了GPT-4,这是一个大型多模态模型,能够处理图像和文本输入并产生文本输
出。这种模型是一个重要的研究领域,因为它们具有广泛应用的潜力,如对话系统、文本摘要
和机器翻译。因此,近年来,它们一直是人们极大兴趣和进步的主题【1-28】。
开发这种模型的主要目标之一是提高它们理解和生成自然语言文本的能力,特别是在更复杂和微妙的
场景中。为了测试它在这种情况下的能力,GPT-4在最初为人类设计的各种考试中进行了评估。在这
些评估中,它表现得相当好,通常得分超过绝大多数人类考生。例如,在一次模拟律师考试中,
GPT-4的分数在考生中排名前10%。这与GPT的3.5分形成鲜明对比,后者排名倒数10%。
在一套传统的NLP基准测试中,GPT-4优于以前的大型语言模型和大多数最先进的系统(通常有特定
于基准测试的训练或手工工程)。在MMLU基准【29,30】上,一套涵盖57个科目的英语多项选择
题,GPT-4不仅在英语方面远远超过现有模型,而且在其他语言方面也表现强劲。在MMLU的翻译
版本上,GPT-4在26种语言中的24种超过了英语的最先进水平。我们将在后面的章节中更详细地讨
论这些模型功能结果,以及模型安全性改进和结果。
该报告还讨论了该项目的一个关键挑战,即开发深度学习基础设施和优化方法,这些方法在广泛的规
模上表现可预测。这使我们能够预测GPT-4的预期性能(基于以类似方式训练的小跑步),并在最
后一次跑步中进行测试,以增加我们训练的信心。
尽管GPT-4有其功能,但它与早期的GPT模型有类似的局限性[1,31,32]:它不完全可靠(例
如,可能出现“幻觉”),具有有限的上下文窗口,并且不学习
*请将此作品引用为“OpenAI(2023)”。完整的作者贡献声明出现在文件的末尾。
凭经验。使用GPT-4的输出时应小心,尤其是在可靠性很重要的情况下。
GPT-4的能力和局限性带来了重大和新颖的安全挑战,鉴于潜在的社会影响,我们相信仔细研究
这些挑战是一个重要的研究领域。该报告包括一个广泛的系统卡(在附录之后),描述了我们预见
的偏见、虚假信息、过度依赖、隐私、网络安全、扩散等方面的一些风险。它还描述了我们为减轻
GPT-4部署的潜在危害而采取的干预措施,包括与领域专家的对抗性测试,以及模型辅助的安全
管道。


电子书下载地址:
通过网盘分享的文件:OpenAI-GPT-4技术报告.pdf
链接: https://pan.baidu.com/s/1mIOq4NLPaeJXRdp5Na5pwg 提取码: knm8
通过网盘分享的文件:OpenAi-GPT-4-技术报告英文版.pdf
链接: https://pan.baidu.com/s/1zlqSParC2rB-0OndqChMKA 提取码: k9c8