导航：首页 > IT资讯 >

劝退效果拉满，最新调查显示 67% 的 NLPer 怀疑自己的研究没价值

发表于：2025-01-22 作者：千家信息网编辑

千家信息网最后更新 2025年01月22日，一味追求大模型是不是走错了路？未来最有影响力的进展是会来自工业界还是学术界？语言模型到底有没有理解语言？我做的研究到底有没有价值？......最近，一项针对 NLP 社区的调查反映了 NLPer 对所

千家信息网最后更新 2025年01月22日劝退效果拉满，最新调查显示 67% 的 NLPer 怀疑自己的研究没价值

一味追求大模型是不是走错了路？

未来最有影响力的进展是会来自工业界还是学术界？

语言模型到底有没有理解语言？

我做的研究到底有没有价值？

......

最近，一项针对 NLP 社区的调查反映了 NLPer 对所有这些重要问题的看法。来自华盛顿大学、纽约大学和约翰霍普金斯大学的组成的研究团队，就 NLP 领域的一些争议性问题征求了广大研究者的意见，包括研究者在大模型、AGI（通用人工智能）、语言理解、未来方向等多个方面的看法。

论文地址：

https://nlpsurvey.net/ nlp-metasurvey-results.pdf

调查结果真是一看吓一跳，竟有多达 67 % 的 NLP 研究者对自己所从事研究的科学价值抱有怀疑态度！

还有网友吐槽：连塔罗牌都比 NLP 靠谱。

其他受访者同意比例相当高的观点还有：

被引用最多的研究成果将来自工业界而不是学术界，如今工业界在引领 NLP 领域发展进程方面的影响力过大；
反对最大化规模可以解决一切问题的假设；
"NLP 寒冬"将在未来 30 年内来临；
NLP 研究人员应该关注 AGI；
NLP 研究人员应该更多考虑整合来自邻近学科（如语言学、认知科学）的见解；
过去 5 年发表的构建可解释模型的大多数研究都走错了方向；等等。

首先简单介绍一下本次调查的受访者情况：

共有 480 位 NLPer 参与了此次调查。其中 327 人在过去三年中至少发表过两篇 ACL 论文，这部分人是调查的目标人群。

在地区分布上，受访者中的 58% 来自美国，23% 来自欧洲，8% 来自亚洲。其中，来自中国的 NLP 研究者占 3%。

73% 的受访者来自学术界，22% 的受访者来自工业界，4% 从事非营利组织或政府工作。其中，教师和高级管理人员占 41%，23% 是初级研究人员（包括博士后），33% 是博士生，2% 是硕士研究生或本科生。

另外，受访者的男女比例分别为 67% 和 25%。

下面我们来看本次调查的详细结果和分析：

1 NLP 领域的整体状况

▲ 图注：对于每个问题，图中底部显示同意、弱同意、弱不同意和不同意的比例。垂直的绿线（绿色数字）表示同意或弱同意该陈述的总百分比。

工业界的领域影响力

Q1-1：私营企业在指导该领域的发展进程方面影响力过大。

Q1-2：未来 10 年被引用最多的论文更有可能来自工业界，而不是学术界。

调查结果显示，绝大多数人（86 %）都认为，未来 10 年，被引用最多的研究成果将来自工业界而不是学术界；但也有 77 % 的人认为，如今的私营企业在引领 NLP 领域发展进程方面的影响力过大。

在许多人看来，一项工作的被引用次数并不能很好地代表其价值或重要性，而且，工业界对该领域的持续主导地位将产生负面影响，比如在基础系统方面的绝对控制地位，就像 GPT-3 和 PaLM。

不过，受访者对这两个问题的回答分歧很大，在学术界人士中，认为工业界的影响力过大的人所占比重为 82 %，而在工业界这一比例为 58%。

NLP 寒冬何时到来？

受访者被询问是否预计在不久的将来会出现一个"NLP 寒冬"，即资金和就业机会较峰值下降至少 50%。

Q1-3：我预计未来 10 年内会出现"NLP 寒冬"。

Q1-4：我预计未来 30 年内将出现"NLP 寒冬"。

有 30 % 的人同意或弱同意寒冬将在未来 10 年内到来，其中仅有 7% 的人选择"同意"；而相信寒冬将在未来 30 年内到来的人要多得多，比例为 62%。

尽管 30 % 不是一个大数字，但这也反映了这一部分 NLP 研究者的一种信念，即 NLP 研究将在不久的将来发生重大变化（至少在谁提供资金以及提供多少资金方面）。为什么他们的态度会相对悲观？背后有许多可能原因，比如由于工业界影响力过大而导致的创新停滞，工业界将凭借少量资源充足的实验室来垄断行业，NLP 和其他 AI 子领域之间的界限将消失，等等。

NLP 在科学上的价值

Q1-5：在 NLP 领域发表的大部分工作在科学价值上值得怀疑。

有 67% 的 NLP 研究者对这一领域研究工作的价值进行了反思，他们认为，大多数 NLP 工作在科学意义上是可疑的。

受访者对"可疑"的定义可能是多样的，包括根本不具有完整性的工作、所研究问题不恰当、研究结果无意义，或者研究发现并不重要、不可靠等等。

作者匿名制度的必要性

Q1-6：评审期间，作者匿名可保证对研究的传播进行限制。

ACL 会议的匿名政策比许多其他会议（如 NeurIPS、ICLR 和 ICML）要严格得多。调查表明，尽管争议很多，但 NLP 社区总体上是支持这一政策的，63% 的人认为匿名可以保证限制预印本的传播）。这个问题也显示出了明显的性别差异，有 77% 的女性表示同意，只有 58% 的男性表示同意。

2 规模化、归纳偏差和来自临近领域的启发

规模最大化是终极方案吗？

Q2-1：规模化（scaling）实际上可以解决任何重要问题。

强化学习之父 Richard Sutton 在其文章 "The Bitter Lesson"中曾发表一个广为人知的观点：利用计算的一般方法最终是最有效的，而且效率提升幅度会非常大。在这种观点下，模型做得越来越大，研究者期望在有足够训练数据和模型容量的情况下，与引入语言结构或专家设计的归纳偏差相比，使用更少的、更通用的原则性学习机制是更优的方案。

然而，这项调查的结果表明，NLP 研究者对 Sutton 这种观点的认可程度实际上远远低于预期。仅有 17 % 的人同意或弱同意：鉴于本世纪算力和数据的可能发展程度，扩大现有技术的实施规模将足以解决 NLP 的所有重要问题。在人人似乎都对大模型趋之若鹜的当下，这个数字是极低的。