人工智能让孩子更聪明,还是只是更快?
第一代普遍使用校园科技的学生,考试成绩反而低于前一代。随着人工智能进入课堂,研究显示同样的模式正在重演。本文将解释这对您选择学校意味着什么——并提供一套您本周就能用上的评估框架。
简短的答案
在现代标准化测试史上,第一次出现了这样一代人:他们在注意力、记忆力、执行功能以及总体智商方面的得分,低于他们的前辈。Z 世代——在屏幕随手可得、科技充斥课堂的环境中长大的一代——在可衡量的认知能力上明显不及千禧一代。如今,人工智能工具正以比十年前平板电脑更大的规模进入学校与职场,而早期的职场数据显示,同样的模式正在重演:产出在上升,但支撑产出的思考能力却在退化。
本文并非反对科技。它主张的是有意识的教育选择——以具体数据为依据,并以一套您下次参观学校时就能用上的框架收尾。
每天使用手机 5 至 7 小时的 15 岁学生,数学成绩低了这么多——相当于近 2.5 年的学习损失
OECD PISA 2022
第一部分:证据
一代人打破了规律
2026 年 1 月 15 日,认知神经科学家 Dr. Jared Cooney Horvath(贾里德·库尼·霍瓦特博士),LME Global 的负责人,向美国参议院商业、科学与交通委员会提交了书面证词。与他一同出席作证的还有 Dr. Jenny Radesky(密歇根大学)、Dr. Jean Twenge(圣地亚哥州立大学)以及 Emily Cherkin(屏幕时间顾问)。他的核心论点是:Z 世代——大致出生于 1997 至 2010 年之间的人——是现代测量史上第一代在基础注意力、记忆力、读写能力、计算能力、执行功能以及与智商相关的指标上得分低于其父母的一代。
Horvath 将这一衰退与约 2010 年开始的大规模课堂屏幕普及联系起来,那正是全球开始推行「一人一平板」计划的时刻。在 2026 年 3 月发表的一篇 Substack 后续文章中,他写道:「当 NAEP 的表现与各州数字化普及程度对齐时,成绩先是停滞,随后下降。」
支撑他论点的并非单一研究,而是多个独立数据集之间的趋同。
PISA 的证据
经济合作与发展组织(OECD)的国际学生评估项目(PISA)每三年对 80 多个国家的 15 岁学生进行测试。2022 年的结果于 2023 年 12 月发布,记录了一次前所未有的下滑:
| 指标 | 变化(2018 → 2022) | 相当于 |
|---|---|---|
| 数学 | −15 points | 约 ¾ 个学年 |
| 阅读 | −10 points | 约 ½ 个学年 |
| 科学 | 下滑(幅度较小) | — |
在 PISA 的评分体系中,20 分大致相当于一年的学习量。这一下滑并不局限于某一个国家或地区——它是全球性的。
当 OECD 专门审视数字设备的作用时,研究结果令人震惊。其 2024 年报告《学生、数字设备与成功》发现:
- 在 OECD 各国,30% 的学生报告称,在「每节或大多数」数学课上会因自己使用数字设备而分心。另有约 25% 的学生报告因其他同学的设备而分心。
- 在数学课上因智能手机分心的学生,比未分心的同龄人低 15 分——相当于四分之三个学年的学习量。
- 每天使用手机 5 至 7 小时的学生,数学成绩比每天使用手机至多一小时的学生低 49 分——相当于近 2.5 年的学习量。
- 适度使用设备(每天至多一小时用于学习)与数学成绩提高 14 分相关。这种关系并非线性的:少量有益,过量有害。
- 45% 的 OECD 学生报告称,当手机不在身边时会感到紧张或焦虑。
Dr. Jean Twenge 于 2026 年初在《青春期杂志》(Journal of Adolescence)上发表了一项独立的同行评审研究,运用 2000 至 2022 年的 PISA 数据,分析了来自 36 个国家的 1,788,128 名学生。她的发现是:在青少年拥有更高智能手机使用权、并在上学时段花更多时间用电子设备进行休闲的国家,学业表现的下滑与孤独感的上升更为显著。这一模式是国际性的,而非孤立现象。
瑞典的实验
直到不久前,瑞典还是全球数字化教育的领先者。2009 年,该国在各校将印刷教科书替换为电脑和平板电脑。到 2019 年,连学龄前儿童都被要求使用数字工具。随后,阅读成绩开始下降。
2021 年,瑞典四年级学生在 IEA 的 PIRLS 国际阅读评估中得 544 分——低于 2016 年的 555 分,下滑了 11 分。瑞典学校事务大臣 Lotta Edholm(洛塔·埃德霍姆)宣布了一项逆转政策,此后成为欧洲最重大的教育政策转变之一:
- 拨款6.85 亿瑞典克朗(2023 年),并自 2026 年起每年拨款5.55 亿瑞典克朗用于实体教科书——每名学生每个科目一本。
- 在义务教育阶段学校强制收缴手机,覆盖整个上学日,预计在 2026 年秋季前实施。
- 学龄前屏幕限制:不要求使用任何数字学习工具;2 岁以下儿童仅使用模拟工具(书籍);其余所有学龄前儿童的非模拟工具受到大幅限制。该规定于 2025 年 7 月 1 日生效。
- 在神经科学家和儿科医生的批评下,政府此前的数字化战略被正式否决。
挪威、芬兰和法国此后纷纷出台了类似的限制措施。荷兰自 2024 年起限制课堂使用手机。全球政策制定的方向已悄然但坚定地发生转变——尽管教育科技的营销预算依然庞大。
为什么科技无法提升学习成果:威廉的综述
很少有研究者像 Dylan Wiliam 教授(迪伦·威廉,伦敦大学学院教育学院教育评估荣休教授)那样长期研究课堂成果。在他 2026 年 1 月的文章中,威廉总结了数十年的观察:
「人们尝试了若干种可能的做法,包括改变学校结构、改变学校治理、改革课程,以及加大数字科技的作用。尽管这些方法各自都取得了一些成功,但在系统层面的净影响接近于零,甚至实际上就是零。」
他的解释简单而难以反驳。威廉引用了 Larry Cuban 的著作《被高估而少用:课堂里的电脑》(Oversold and Underused: Computers in the Classroom,2002 年),主张唯一能可靠提升学生成果的因素是教师质量。在最优秀教师的课堂里,学生的学习速度是普通课堂的两倍。科技改变的是传递方式,它并不改变机制。当它挤占了机制本身——当屏幕取代了真正构建思考的互动时——成果便会下降。
手写的神经科学
一项具体的发现支撑了瑞典的政策逆转。2024 年 1 月,挪威科技大学(NTNU)的 Audrey van der Meer 与 Ruud van der Weel 教授在《心理学前沿》(Frontiers in Psychology)上发表了一项高密度脑电图(EEG)研究,比较了手写与打字时的大脑活动。他们在 36 名大学生身上使用了 256 个传感器,发现:
- 手写在与记忆形成、感官处理和注意力相关的中央与顶叶脑区,产生了广泛的 theta 波和 alpha 波连接(3.5–12.5 赫兹)。
- 打字在同样这些脑区只产生了极少的连接。
- Van der Meer 的总结是:「与打字相比,手写几乎激活了整个大脑,而打字本身几乎不激活大脑。」
Van der Meer 指出,那些只在平板电脑上学习读写的孩子,「可能难以分辨彼此互为镜像的字母,比如『b』和『d』。他们的身体从未真正感受过书写这些字母是什么感觉。」
这建立在 Mueller 与 Oppenheimer 颇具影响力的 2014 年研究《笔比键盘更有力》("The Pen Is Mightier Than the Keyboard")的基础上。该研究发现,手写笔记的学生在概念性问题上的表现优于用笔记本电脑记笔记的学生——因为手写迫使他们去处理和归纳,而不是逐字誊录。
第二部分:同样的模式如今正在职场形成
倘若这只影响学校,家长们还能在家中加以弥补。但同样的动态如今正在职场显现,这意味着它将塑造您的孩子毕业后步入的世界。
使用人工智能的员工报告出现「大脑过载」——因监管超出自身心智承受能力的人工智能而产生的急性认知压力
BCG 对约 1,500 名美国员工的调查,2026 年
加州大学伯克利分校的研究
2026 年 2 月,Aruna Ranganathan(加州大学伯克利分校哈斯商学院副教授)与 Xingqi Maggie Ye(伯克利哈斯商学院博士生)在《哈佛商业评论》上发表了《人工智能并未减少工作——它加剧了工作》。他们对一家美国科技公司的 200 名员工进行了为期八个月的追踪,发现:
- 人工智能工具并未减少工作——反而加剧了工作。
- 在最初的生产力激增之后,员工的工作时间更长、节奏更快、涉及的任务范围更广。
- 到第六个月,倦怠、焦虑和决策瘫痪急剧上升。
- 「工作量蔓延」——员工承担的任务超出了可持续的限度,导致认知疲劳和更低质量的工作。
「大脑过载」研究
2026 年 3 月,波士顿咨询公司由 Julie Bedard 与 Gabriella Rosen Kellerman(一位精神科医生,曾与 Martin Seligman 合著《明日心智》(Tomorrowmind))带领的团队,在《哈佛商业评论》上发表了《当使用人工智能导致「大脑过载」时》。在对近 1,500 名美国全职员工进行调查后,他们发现:
- 14% 使用人工智能的员工报告经历了「大脑过载」——定义为因过度使用、交互以及监管超出自身认知能力的人工智能工具而产生的精神疲劳。
- 症状包括大脑迷雾、头痛、决策变慢,以及一位参与者所描述的*「脑子里同时开着十几个浏览器标签页」*。
- 大脑过载有别于倦怠:它是急性认知压力,而非慢性情绪耗竭。
- 关键在于,当人工智能被用于消除重复性任务时,员工报告的倦怠更低、投入度更高。问题不在于人工智能本身——而在于不设边界地使用人工智能。
《商业内幕》(Business Insider)在 2026 年 3 月将这一更广泛的趋势称为《人工智能大去技能化》:人工智能制造出一种专业能力的假象,同时悄然侵蚀着造就这种能力的判断力。
对家长而言,那个令人不安的问题是:如果您孩子未来职场中的成年人正在丧失独立推理的能力,那么让您孩子的职业生涯脱颖而出的技能,便不是对人工智能的熟练运用,而是人工智能无法取代的思考能力。
第三部分:不同年龄段意味着什么
对一个六岁孩子和一个十六岁孩子而言,所关注的问题并不相同。以下是研究对每个阶段的发现。
6–10 岁:奠基的岁月
这是工作记忆迅速扩展、执行功能发育、阅读流畅性建立,以及精细动作技能——包括 van der Meer 所记录的手写神经通路——逐渐形成的时期。世界卫生组织(WHO)建议 5 岁以下儿童每天娱乐性屏幕时间不超过一小时;对 6–10 岁的儿童,没有任何权威机构给出具体限额,但证据清楚地表明,挤占才是主要风险。每在屏幕前花一小时,就是少了一小时用于体能游戏、社交互动、阅读或动手探索。
应优先考虑的事项: 手写教学。数学的实物操作教具(新加坡数学的「具体—图像—抽象」教学法,学生先使用积木和条形模型,再过渡到符号)。用实体书进行的朗读与自主阅读。无结构的自由游戏。
11–13 岁:关键窗口期
前额叶皮层——负责目标规划、冲动抑制和抽象思维的脑区——在 13 至 15 岁之间经历重塑的高峰。突触修剪加速:大脑实际上正在根据使用情况,决定保留哪些神经连接、淘汰哪些。在这个年龄,*「用进废退」*在神经学上是字面意义上的真实。
这是学生首次能够真正参与假设性推理、哲学问题以及多步骤逻辑论证的时期。这也是大多数孩子开始拥有智能手机的年龄,而 PISA 数据显示,分心效应正是从此时开始显现。
应优先考虑的事项: 这正是苏格拉底式提问、基于讨论的学习以及哲学探究在发展上变得适宜并且影响力最大的窗口期。如果批判性思维的神经通路在这个修剪窗口期内未得到锻炼,它们可能会被永久削弱。学生需要在人工智能工具向他们开放之前,先练习独立推理。
14–16 岁:负责任的融合
到了这个年龄,问题从「学生是否应该使用科技?」转变为「他们应该如何使用科技?」。国际文凭组织(IB)的做法颇具借鉴意义:人工智能生成的内容必须像任何其他来源一样被引用——在正文中注明出处,并在参考书目中列出。IB 在 2023 年明确表示不会禁止人工智能,称禁令是*「应对创新的一种无效方式」*。相反,它要求在人工智能所提供内容的基础上进行披露、评估和原创思考。
应优先考虑的事项: 将人工智能素养作为一项技能(理解大语言模型能做什么、不能做什么)。强制披露人工智能的使用。过程记录——草稿、思考日志、修订历史。大量的课堂内手写评估,以验证真实能力。目标是培养能够把人工智能当作思考伙伴而非替代品的学生。
第四部分:评估学校的框架
上述研究并非主张把您的孩子送进一所禁止科技的学校。它主张的是选择一所科技是构建思考的课程中的一种工具——而非课程替代品——的学校。
这个区别至关重要,因为教育领域的科技营销在两种情况下看起来一模一样。一所在每间教室都部署了 iPad 的学校,与一所将 iPad 融入严谨、以教师为主导课程的学校,会在宣传册上使用相同的措辞。
五分钟课堂测试
如果您有机会参观学校,请观察任意一间教室五分钟:
- 看墙壁。 展示的是学生的思考(推理、问题、草稿、「我想知道……」之类的表述),还是仅仅是成品和装饰?
- 数比例。 教师说话的分钟数与学生说话的分钟数各占多少?以讨论为核心的精英学校(哈克尼斯教学法,用于菲利普斯埃克塞特学院和惠灵顿公学)的目标是学生发言占 70–80%。普通学校则是教师发言占 80% 以上。
- 看课桌。 学生是面对面(便于协作、适合讨论),还是全部朝向前方(讲授式)?
- 问一名学生。 「你正在做什么,为什么要做?」如果他们能说出目的,说明教学是有效的。如果他们说「因为老师让我们做」,那就不然了。
- 寻找手写。 学生是否还在手写,或者一切都在屏幕上完成?
揭示学校真实做法的 10 个问题
关于教学方法
-
「您能向我介绍一下,一节关于某个难点概念的典型课程是如何教授的吗?」 留意提问的层次、学生讨论、范例讲解和形成性评估。如果答案围绕着使用哪款应用或平台展开,请保持怀疑。
-
「除了标准化考试之外,学生的理解是如何被评估的?」 留意扩展论文、口头答辩、苏格拉底式研讨、基于项目的评估,以及教师撰写的反馈。使用哈佛零点项目「可见的思考」常规——诸如*「看—想—疑」和「论点—支撑—质疑」*等流程——的学校,正在结构性地培养元认知。
-
「贵校能做到哪些资源充足的在线平台做不到的事情?」 一所好学校会有自信而具体的答案。一所差学校则会语塞。
关于科技政策
-
「设备在哪些年龄段使用,每天使用多久?」 与 PISA 的证据对照:适度使用(每天至多一小时)与适度的成绩提升相关;过度使用则与急剧下滑相关。
-
「贵校在上学日对智能手机的政策是什么?」 允许在课堂上使用手机的学校,是在无视 PISA 数据。无手机学校与允许手机学校之间的差距,如今已能在考试成绩中量化体现。
-
「贵校如何处理学生作业中的人工智能?」 一个有分寸的回答会区分作为学习辅助的人工智能(在披露的前提下可以接受)与作为原创思考替代品的人工智能(不可接受)。说「我们禁止它」的学校还没想清楚。说「我们还没有相关政策」的学校则落后了。
关于课程设计
-
「贵校的课程如何培养批判性思维和独立推理?」 对 IB 学校:询问知识论(TOK)——一门必修课程,学生需撰写一篇 1,600 字的论文,分析知识是如何构建的,外加自 2022 年起新增的 TOK 展览,将现实世界的物品与认识论概念相联系。对 A-Level 学校:询问其深度和评估方式。对 AP:具体询问 AP 研讨课与 AP 研究课(Capstone 项目)——若没有这些,AP 主要就是内容加考试。
-
「学生有多少书写是手写完成的,尤其是在低年级?」 van der Meer 的研究很清楚:手写激活了打字所无法激活的记忆、注意力和感官处理网络。
-
「我能看一份两年前的学生作品样本吗?」 注重构建思考的学校会展示扩展性书面作业、科学展览项目和分析性论文。为产出而优化的学校则会展示精美的演示,而其下的论证却很单薄。
-
「对于一个答对了却无法解释原因的学生,贵校如何处理?」 这能揭示学校看重的是理解,还是服从。
危险信号宾果
如果您在参观学校时听到以下三条或更多,而对方没有给出实质性解释,请保持怀疑:
- ❌ 「我们是一所一人一设备的学校」(却不解释为何设备能提升学习)
- ❌ 「人工智能驱动的个性化学习」(通常意味着 1960 年代的分支逻辑套上了现代界面)
- ❌ 「21 世纪技能」(却不点明具体是哪些技能,或如何衡量)
- ❌ 「面向未来」(却不界定这意味着什么)
- ❌ 「我们的学生是数字原住民」(这是一个已被驳斥的迷思——出生在科技身边并不等于理解科技)
- ❌ 「数据驱动的教学」(却不向您展示数据,或说明它如何改变教学)
- ❌ 「因材施教,照顾到每一个学生」(几乎每个教育科技供应商都在用的营销话术)
关于课程选择的一点说明
在 IB、A-Level 和 AP 之间抉择的家庭常常会问哪个最好。三者都能产生出色的成果,但它们对认知需求的分配方式各不相同:
| 维度 | IB 文凭 | A-Levels | AP |
|---|---|---|---|
| 核心批判性思维要求 | 知识论(必修,外部评估) | 无必修 | AP 研讨课 / 研究课(可选的 Capstone) |
| 强制性原创研究 | 扩展论文(4,000 字,外部评估) | 可选 EPQ,但非强制 | AP 研究课(可选) |
| 广度与深度 | 广度:6 门科目 + 核心 | 深度:通常 3 门科目 | 模块化:4–10 门课程 |
| 评估的抗人工智能性 | 高(口头答辩、扩展论文、内部评估) | 高(笔试) | 中等(许多考试以选择题为主) |
| 伦理推理要求 | 嵌入每一个知识领域(2022 年后的课程) | 因科目而异 | 因科目而异 |
| 全球认可度 | 普遍 | 在英国/英联邦最强 | 在美国最强 |
如果您最关心的是培养人工智能无法替代的独立思考能力,那么 IB 文凭的核心组成部分(TOK、扩展论文、CAS) 在结构上与这一目标最为契合。这并不是说每一所 IB 学校都能把这件事做好——只是说该课程在设计上要求做到这一点。
结论
Horvath 博士在参议院作证时以一句话作结,其适用范围远不止于课堂:
「我们正在重新定义教育,以更好地适应工具。这不是进步。这是投降。」
将在人工智能充斥的世界中蓬勃发展的孩子,不会是那些最早学会使用人工智能的孩子。横跨二十年、80 多个国家,如今再加上早期的职场数据,研究始终如一:工具提升产出,但不提升思考。真正蓬勃发展的孩子,将是那些学会了不依赖工具去思考——然后再有意识地、带着判断力,选择何时拿起工具的孩子。
作为家长,您的着力点在于选择学校的那一刻,以及您每周向孩子提出的问题之中。上述框架是一个起点。如果您希望有人帮助您将它应用到您候选名单上的具体学校——比较课程、评估教学方法、并规划入学申请——预约一次免费的 30 分钟咨询。
资料来源
- Horvath, J.C. (2026). 书面证词,美国参议院商业、科学与交通委员会,2026 年 1 月 15 日。
- Horvath, J.C. (2026). 《我参议院证词背后的 NAEP 证据》。The Digital Delusion(Substack),2026 年 3 月。
- OECD (2023). 《PISA 2022 结果(第一卷与第二卷)》。OECD Publishing,巴黎。
- OECD (2024). 《学生、数字设备与成功》。PISA,OECD Publishing,巴黎。
- Twenge, J.M. (2026). 《学业表现的国际性下滑与孤独感的上升与电子设备相关》。《青春期杂志》(Journal of Adolescence),98(1):250-261。
- IEA (2023). 《PIRLS 2021 国际阅读评估结果》。
- 瑞典政府 (2024). 《政府投资于更多阅读时间和更少屏幕时间》。
- Wiliam, D. (2026). 《我们如何让学生为一个我们无法想象的世界做好准备?》 Substack,2026 年 1 月 7 日。
- Van der Meer, A. & van der Weel, R. (2024). 《手写而非打字带来广泛的大脑连接》。Frontiers in Psychology。
- Mueller, P.A. & Oppenheimer, D.M. (2014). 《笔比键盘更有力》。Psychological Science,25(6):1159-1168。
- Ranganathan, A. & Ye, X.M. (2026). 《人工智能并未减少工作——它加剧了工作》。Harvard Business Review,2026 年 2 月 9 日。
- Bedard, J. et al. (2026). 《当使用人工智能导致「大脑过载」时》。Harvard Business Review,2026 年 3 月 5 日。
- Business Insider (2026). 《人工智能大去技能化已经开始》。2026 年 3 月。