科創001| 17歲、論文“一作”、被馬斯克點贊:當“00後”提前上桌

深圳商報·讀創客戶端首席記者 袁靜嫻

17歲,論文一作,被特斯拉創始人馬斯克點贊——這不是一段設定好的“天才劇本”,而是真實發生在陳廣宇身上的一幕論文

3月中旬,月之暗面Kimi團隊釋出論文《Attention Residuals》,這項關於大模型結構的創新,引發業內關注論文。而隨著馬斯克的轉發與評論,第一作者之一的陳廣宇也迅速被推到聚光燈下。

比起“少年天才”的標籤,更值得被討論的或許是另一件事:當17歲就可以參與大模型核心研究,這樣的路徑,正在變得不再罕見論文。隨之被放大的,不只是一個少年的經歷,還有一個逐漸清晰的趨勢:越來越多“更早登場”的年輕人,正在進入技術與創業的核心地帶。

科創001| 17歲、論文“一作”、被馬斯克點贊:當“00後”提前上桌

從駭客松到矽谷論文,17歲少年如何走進AI前沿

時間回到3月16日論文

當天,月之暗面Kimi團隊發表了論文《Attention Residuals》(“注意力殘差”),把OpenAI聯合創始人Ilya Sutskever提出的設想變成了現實,提升了大模型在複雜上下文中的資訊篩選與呼叫能力論文

隨後,馬斯克點贊並在社交平臺發文稱,Kimi這項工作“令人印象深刻”論文。此舉把Kimi團隊的這一論文帶入更多公眾視野,作為該論文的共同一作之一的陳廣宇,也迅速引起討論。

陳廣宇出生於2009年,今年17歲,正在深圳貝賽思體系學校就讀高中論文

科創001| 17歲、論文“一作”、被馬斯克點贊:當“00後”提前上桌

展開全文

“很少有16歲的孩子,能用行動把人生切換到另一條軌道論文。廣宇是其中一個。他從一場駭客松出發,一路走進科研、實習和矽谷。不是因為他贏過什麼大比賽,也不是天賦異稟,而是因為他願意動身,願意試,願意親自去看世界。”奇績創壇(原YC中國)創始成員董科含如此評價陳廣宇。

2025年2月,北京一場中學生駭客松上,陳廣宇展示了一個關於“人類第三隻機械輔助手”的創新構想——ThirdArm論文。正是在這場活動上,陳廣宇結識了評委董科含。很快,陳廣宇就入選了董科含發起的面向全球15–17歲青年的高潛力未來領袖計劃。從駭客鬆開始,陳廣宇慢慢開啟科研、實習之路,並一路走到了美國矽谷。

在接觸科研之前,陳廣宇坦言,自己更喜歡的是“做產品、玩創意、跑市場”論文。中學時他就試著用家長身份註冊 Shopify店鋪,拍產品照、投廣告,還做過短影片賬號四天漲了29萬粉。此外,陳廣宇也組織過青少年開源社羣、機器人等等。

當時還不知道什麼是Transformer的陳廣宇,經董科含引薦認識了DeepSeek研究員袁境陽,在袁境陽的指導下,陳廣宇開始利用Gemini作為輔助工具,研讀經典論文、追蹤GitHub開源專案等方式,逐步建立認知論文

學習的過程中,有一次陳廣宇在推特上發表了對一篇部落格的反思,引起了一家矽谷AI初創公司CEO的關注論文。該公司在2025年初完成800萬美元種子輪融資,資方背景涉及OpenAI與Anthropic。對方很快向陳廣宇丟擲了橄欖枝——邀請陳廣宇到公司實習。

2025年的暑假,陳廣宇坐上飛往矽谷的航班,開啟了為期7周的實習論文。實習期間,陳廣宇主導定義了一個涉及144張H100顯示卡的探索專案,同時他還與該公司創始人一起參與技術開發、探討融資策略討論、認識了更多的工程師等等。

2025年11月,陳廣宇加入了月之暗面,參與Kimi大模型結構層的最佳化論文。據陳廣宇發表在董科含公眾號的文章介紹,月之暗面吸引陳廣宇的原因之一,是Kimi團隊一直做的Flash Linear Attention這一類高效Attention工作,而這也是陳廣宇在開始學習AI時,所接觸的GitHub上的FLA專案。

讓大模型學會篩選資訊

那麼Kimi團隊此次發表的論文論文,主要是講什麼?

在使用大模型的過程中,不少使用者都有這樣的困擾:隨著與大模型對話的內容和丟給它的素材越來越多,大模型就越來越傾向於“大腦爆炸、記憶過載”的狀態,雖然它會盡可能記住所有資訊,但仍然缺乏有效的篩選機制,導致給出的結果抓不住重點、資訊匹配錯亂等論文

此前,OpenAI聯合創始人Ilya Sutskever就提出可以把按時間先後順序處理資料的LSTM網路“旋轉90度”,即把時間軸換成模型深度軸,變成殘差網路的設想論文

Kimi團隊則認為,如果時間上的LSTM能對應深度上的殘差,那淘汰了LSTM的“注意力機制”也可以照做論文。於是,Kimi團隊開發了一套Attention Residuals技術,相當於把注意力機制也“旋轉了90度”。在這套新方法下,模型在計算當前層時可以聰明地“回頭看”,根據需要自由決定去提取前面哪一層的資訊。

Kimi團隊把這一套方法在Kimi Linear架構上做了測試,結果顯示,訓練效率提升25%,推理延遲增加不到2%論文

“00後”開始陸續登場了

陳廣宇的這次出圈,也讓“00後”這一代創業者與技術人才,開始更頻繁地進入投資人與公眾的共同視野論文

比如,成立於2025年1月的零次方機器人,其創始人閔宇恆、程頤、李宜哲,均是“00後”,也是清華大學深圳國際研究生院的在讀生論文。零次方機器人在成立半年內,累計完成了天使輪、天使+輪、天使++輪總計過億元的融資,成為2025年創投圈的現象級專案。

如果說過去,創業仍然是一條需要經歷“名校—大廠—融資”的標準路徑,那麼近兩年,這條路徑正在被悄然改寫論文

一方面,以大模型為代表的新一輪技術工具,大幅降低了技術探索與產品驗證的門檻;另一方面,開源社羣、駭客松、社交平臺等新型入口,也讓更多年輕人得以繞開傳統體系,直接進入一線技術與創業網路論文

在這樣的背景下,“00後”不再只是被觀察的一代,而是開始更早地進入牌桌、參與競爭,甚至是定義問題的人論文。也正因此,一個更現實的問題開始浮現:在投資人眼中,什麼樣的年輕人,更有可能從“早起步”走向“走得遠”?

“真正能走得遠的年輕人,往往不合邏輯,但卻符合一種直覺論文。是因為他們敢在沒人看懂的時候投身去做。他們敢於說出還沒成體系的想法,做出沒人能理解的產品,在孤獨中堅持自己節奏。”在董科含看來,有著“創業天才”預兆的他們,不一定起點高,表達也可能笨拙,但只要給時間和一點能量,就會突然長成別人看不懂的樣子。

近10年來,董科含累計帶過7000多人、接觸過10萬名創業者論文。結合創業成功的年輕人共同特點,董科含總結了部分“創業天才”的本質特點。比如:有控制不住的好奇心;極度自信,極度相信自己會贏;邏輯極清晰,並且能用簡單的語言表達清楚;動手能力極強,喜歡親自上手解決問題;不能忍受低效,哪怕是別人浪費時間也會不舒服等等。

其次是創業成功機率的增強特徵:比如天然遮蔽噪音,一次只做一件重要的事,直奔問題本質;自我驅動的完美主義,總要把事情推到極限邊界;有自己的判斷,不同觀點;對細節高度關注等等論文

“這些年輕創業者的觀點不一定對,甚至很多是愚蠢、未完成、粗糙的,但他們敢說、敢做、敢堅持,有一種奇怪的能量,混著真實、傲慢、野性和覺悟論文。他們不去背那些標準答案,去複述別人的觀點,而是去做一個反常識、但真實的專案,同時他們相信構建比證明重要,不急於贏一次比賽,而是要自己造一個新的賽道。”在董科含看來,“他們不是模仿者,是造路者。”

另一位投資機構的負責人向記者表示,陳廣宇的意義,或許不在於“17歲”本身,而在於當一個高中生可以參與大模型底層研究,並被全球頂級技術人物關注時,“成為創業者”這件事,正在被整體前移論文。在他看來,起點被拉低了,門檻被重寫了,路徑被壓縮了,但賽道並沒有變得更簡單。對這一代人來說,真正的分水嶺,或許不再是“有沒有機會”,而是——當機會提前到來時,是否已經準備好承接它。

(圖片來源於陳廣宇個人社交平臺)

本站內容來自使用者投稿,如果侵犯了您的權利,請與我們聯絡刪除。聯絡郵箱:[email protected]

本文連結://www.yxd-1688.com/tags-%E6%9B%B2%E7%B7%9A.html

🌐 /