SQA-041

[Paper] GPT-4 Technical Report

Oct 27, 2025

这个报告以报结果为主，没有公开太多细节

整理:

GPT-4 完全基于 Transformer, 并使用 next token prediction pretrain
预训练后使用 RLHF 做了 alignment
模型可以接受 图像+文本 输入。但是没有公开技术细节。GPT-4o 进一步可以输出图像等模态

其它信息如下：

里面提到了如何使用小模型 ($<1/1000$) 的训练计算来预测最终模型的结果，包括 loss 和 evaluation score (近似)。也就是 scaling law
里面提到 post-training 对模型的推理能力/考试能力无显著影响，也就是还没有开始 RLVR
Test-time techniques (CoT, few-shot prompting) 对多模态输入依然生效