「立即訂閱」 A級透明度項目半月報,發現 1% 的項目
API 下載RootData App

2023 年 Jeff Yan 談自己為什麼要做 Hyperliquid?

2026-01-30 09:53:54

分享至

作者|@flirting with models

編譯|Aki 吳說區塊鏈

本期節目的嘉賓是 Hyperliquid 創始人 Jeff Yan。Jeff 的職業生涯始於 Hudson River 的高頻交易領域,隨後轉向加密世界,在該賽道打造了規模龐大的做市商之一。深入討論了中心化加密交易所的基礎設施、對抗性的算法,以及為什麼 HFT(高頻交易)的盈虧實際上可能對中期價格走勢具有預測性。解釋了他眼中當前去中心化交易所存在的問題,並介紹了 Hyperliquid 的早期理念。本期節目發布於 2023 年 5 月 8 日,可以從中看到 Jeff Yan 早期的很多想法。

如何從哈佛走進加密交易

Jeff Yan:我的經歷大概和很多 HFT 從業者相似:我畢業於哈佛大學,主修計算機科學和數學,隨後直接加入 Hudson River Trading,這是一家在傳統金融裡規模較大的做市機構。我當時做的是美股,體驗非常好。我入職時公司大概 150 人,現在已經大了很多。在這裡讓我受益匪淺,能接觸到最有意思的問題,工程與數學可以完美結合,對量化來說幾乎是"天堂"。到了 2018 年,伴隨以太坊智能合約的熱潮,我讀了(以太坊)Yellow Paper,瞬間就"開竅了",我確信那會是未來,於是離職去做一種 L2 方向的交易所協議。

當時我們選擇切入預測市場方向,是因為彼時 Augur 已經呈現出較強的產品市場匹配(PMF)跡象,而我們自身更擅長、也更關注交易所底層技術能力。因此我們完成融資後,搬到 San Francisco 組建團隊。但幾個月後,我還是決定關停項目,因為時機並不成熟:一方面監管不確定性極高;另一方面用戶獲取非常困難。彼時大多數人並不熟悉智能合約,興趣更多集中在代幣投機上,對 DeFi 的真實需求尚未形成,所以項目最終被搁置。

隨後我花了一段時間反思與旅行,最終選擇回到交易。相較於持續在市場裡"苦找 PMF",交易本身更直接、更有趣。起初我也考慮過加入一家成熟公司,但想到自己做過加密產品、對行業機制更熟悉,便先從自營加密交易做起。最開始這只是副業,但很快我就看到了顯著機會,業務擴張速度遠超預期。市場的低效程度令我驚訝。此後我幾乎埋頭投入了近三年:真正系統化啟動是在 2020 年初,時點也恰好與市場周期共振。隨著市場規模與成交量增長 10 倍甚至 100 倍,我們也同步做大,最終市場份額進入中心化交易所(CEX)做市商的第一梯隊。

約一年前,我們開始系統評估 DeFi 交易機會。這與早期切入 CEX 交易時的觀察相似 --- --- 低效環節廣泛存在。但不同之處在於,部分 DeFi 協議在機制設計上存在先天不足,導致交易體驗與資本效率受限。與此同時,FTX 事件後,市場對"not your keys, not your coins"以及對手方風險的認知顯著強化,對真正去中心化產品的需求持續上升。基於上述變化,我們判斷構建去中心化交易所的窗口期已經到來。過去一到兩季度,我們持續投入資源推進該方向;高頻交易(HFT)業務則更多處於相對穩定的運行與維護狀態,而當前的主要投入與關注重點,集中在將這條去中心化交易技術棧扎實落地並完成體系化搭建。

做市還是吃單:兩者有何區別

Jeff Yan:在我看來,這確實是進入高頻交易時首先需要作出的重大決策。從宏觀層面看,兩者有不少相似之處:本質上都對基礎設施要求極高,且對時延高度敏感。但在許多關鍵環節上,兩者又呈現出相反的側重:做市更倚重基礎設施能力;吃單更倚重統計與數學建模。

我認為選擇哪條路徑,主要取決於你更傾向投入哪類工作與研究。以做市為例,你在一定程度上受制於"將報價打穿"的對手盤,容錯空間很小。通常通過槓桿、在多個品種與多個價位掛單,會形成較大的隱含風險敞口;一旦出現錯誤,尾部風險的代價往往很高。相比之下,吃單策略可以一天只觸發一次 --- --- 仍可能是有效的高頻策略,可能基於新聞,也可能基於某類細分信號。

正因觸發較少,你有空間將模型做得更精細:大部分時間不觸發並不影響,只要觸發時表現足夠好即可。相反,做市並不具備這種彈性 --- --- 即便 99% 的時間運行良好,只要有 1% 的時間略慢、未能及時跟隨數據,相關損失就可能足以抹去其餘 99% 的全部 PnL。這就是"基礎設施驅動"與"模型驅動"的根本差異。

Corey Hoffstein:是否可以這樣更直觀地理解:選擇"吃單"的一方之所以願意跨越買賣價差,是因為其預期價格將沿自身方向繼續運行,因此願意承擔點差成本;而"做市"的一方則希望價格在其交易時間窗內儘量保持穩定 --- --- 當有人跨價差與其成交後,再在另一側完成對沖或反向成交,從而獲取點差收益。以此區分是否合理?即一方在所處時間窗內更希望市場橫盤,另一方則更希望出現方向性運動。

Jeff Yan:是的,基本可以這樣理解。在高頻交易中,我們通常以極短的時間窗來評估 markout(回看收益),但這一判斷放到更一般的交易頻率同樣成立:只要你選擇"吃單",在以中間價計量的那一刻,你會立刻承擔一筆確定性損失(點差與費用)。只有在隨後、在你設定的預測時間窗內,價格的平均走勢能夠覆蓋這筆即時損失並進一步補償費用,你的策略才具有正期望。

做市則恰好相反:在成交瞬間,你的"初始 PnL"往往處於該筆交易可能實現的最高水平 --- --- 因為你剛剛獲取了一個點差。你所押注的是,這部分收益在平均意義上不會被"劣化選擇"完全侵蝕。

因此,在做市場景下,如果將所有成交按時間維度進行 markout 觀察,PnL 隨時間遞減通常是更常見的形態;你的期望只是其遞減幅度不要演變為負值。

Corey Hoffstein:我們通話前你提到,把業務規模做大,最難的部分其實不在研究,而在基礎設施。我也在 X 上看到你有類似表述:"會做數據歸一化不保證你能賺錢,但不會做你肯定賺不到。"能否談談你們在基礎設施方面最大的經驗教訓,以及為什麼它如此關鍵?

Jeff Yan:這個問題大致可以拆成兩部分,並且二者緊密相關:一是"交易基礎設施",二是"研究基礎設施"。數據清洗更偏向後者,屬於統計實踐的一部分;前者則是狹義的高頻交易系統。兩者都極其重要。

研究層面雖然更為人所熟知,但需要強調的是:高頻交易中的"信噪比"與噪聲形態,比學術研究中多數對象要糟糕幾個數量級,因此對異常值的處理重要得多。

如果對這些問題缺乏正確的處理框架,僅僅簡單忽略異常值,那麼一旦出現黑天鵝尾部事件,模型可能被直接擊穿;但如果又未能做好規範化或過濾,極端樣本又會主導模型訓練與參數選擇。具體實踐中,在許多任務裡使用分位數往往比直接使用原始數值更為魯棒;即便使用原始數值,也需要在"丟棄異常值"與"裁剪異常值"之間作出明確取捨,而這些選擇對最終效果的影響往往非常顯著。

最大的教訓聽起來很樸素:必須親自審閱數據。不要以為自己足夠聰明、管道足夠"乾淨",模型輸入就會自動符合預期。用於檢查原始數據的時間很難被視為"過多" --- --- 因為每一次審閱幾乎都會帶來新的發現。團隊早期應當將交易所提供的全部原始數據流完整落盤,逐條核對,主動識別異常並進行一致性校驗。

有一個看似荒誕但真實發生過的案例:某段時間,一家交易所在行情推送中出現缺陷,將"價格"和"數量"字段對調。比如比特幣的 20,000 / 0.1 被記錄為 0.1 / 20,000,導致我們內部的統計與計數邏輯全面失真。許多團隊因此不得不緊急停機或切換至備用數據源。這類事件說明:無論你的邏輯設計得多麼"健壯",都不可能覆蓋所有異常情形,因此應盡可能保持對原始數據的貼近與可追溯性。

並且還要高度關注時間戳。交易所往往會在數據中提供多種時間戳,其真實含義需要自行拆解與對齊。這一點對於理解"黑盒時延"尤為關鍵 --- --- 你究竟在測量什麼?你是確實"跟上"了市場,還是對方在推送質量較差的數據?通過時間戳的拆分與比對,可以較好地區分這些情形,從而判斷鏈路是否健康、時延是否處於可控區間。

什麼是"公允價(fair)"?如何度量,為何高頻做市要圍繞它交易?

Jeff Yan:不同交易公司對 fair 的定義確有差異,往往取決於各自的交易風格。但其共通點在於:fair 本質上是將你的建模結果凝練為一個"預測價格"。這一抽象非常有價值,因為它把"如何構建可盈利策略"拆解為兩部分且同等困難的任務:價格預測與訂單執行。

這也呼應你此前關於做市與吃單的提問:做市更偏向執行側,吃單更偏向建模側。對吃單策略而言,研究與決策幾乎都圍繞"公允價"展開。至於公允價應納入哪些信息,取決於你認為自己在哪些數據處理環節具備優勢,以及市場的效率缺口具體存在於何處。

此外,公允價並不必然只有一個。在更偏機器學習的框架下,你可以同時維護不同預測期限的公允價,例如 1 秒預測與 1 天預測;執行策略會以不同方式加以利用,而對應的優化目標也可能在 PnL 維度上各不相同。

對入門者而言,一個相對有效的"粗切法"是:先給出一個你願意圍繞其進行報價或跨越價差的單一數值,並將其視為你的"預言機";隨後在擁有歷史價格序列的前提下,進一步思考如何圍繞該數值實現最優執行。

Corey Hoffstein:是否可以將其簡化理解為:觀察某一交易所,若假設 Binance 匯聚了幾乎全部流動性,則可將 Binance 的價格視為公允價;若其他交易所(如 OKX)在毫秒到秒級存在滯後,則可依據 Binance 的公允價跨越價差進行交易,等待其"追價"。當然也存在更偏統計的做法,即不以單一交易所為"真值",而是結合訂單簿相關信號來估計公允價。這樣的解釋是否成立?我也並不完全確定。

Jeff Yan:是的,思路正確。以流動性最強的交易場所作為公允價(fair),確實是一個很好的第一近似。早期各交易所之間常出現 10% 量級的價差,彼時的主要難點並非價格預測,而在於如何在交易所之間高效轉移資金;因此這種方法在當時非常有效。近幾年市場經歷了一個演變過程:流動性先是分散,隨後又回流並向幣安集中(尤其是近期)。因此,正如你所說,將幣安價格作為公允價是一個合理的起點。

但需要強調的是,將外部單一來源直接等同於公允價仍需謹慎。例如 OKX 的滯後可能僅為數毫秒,實際交易並不一定如表述般直接。再進一步,假設存在一種機會:每當幣安價格變動而 OKX 尚無人吃單,你便據此進行跟隨交易並試圖平倉套利 --- --- 多數情形下可能有效,但這畢竟是加密市場,存在非連續性風險:例如 OKX 突然進入錢包維護,導致幣安與 OKX 之間的充提被暫時切斷,套利鏈條無法閉合,價格也可能隨之發散。此時若你的公允價僅依賴幣安價格,反而可能面臨被動風險暴露。

因此,細節因素非常多。即便在這一看似直觀的框架下,也遠不止"從某個數據源取一個數作為公允價"那麼簡單 --- --- 它只能作為良好的第一近似。

Corey Hoffstein:這也正好引出我接下來想問的:加密交易所在技術層面的諸多特性與"陷阱"。從歷史經驗看,它們的技術口碑並不穩定:你前面提到過"髒數據"的例子(例如將價格與數量字段對調)、API 崩潰、文檔質量不佳、隱藏端點,甚至存在未公開的參數。我記得你最近還在 X 上舉過例子:可以繞過風控引擎,或讓風控引擎並行運行 --- --- 這些完全未被文檔化的細節,構成了與價格預測無關、相互獨立的"正交 alpha"。我的問題是:諸如深入理解 API 細節、準確測量端點延遲這類工作,究竟能貢獻多少 alpha?與之相比,更"傳統"的統計類 alpha(例如利用訂單簿信號判斷壓力與方向)孰輕孰重?

Jeff Yan:你提到的那條推文,我記得反響確實不錯。

Corey Hoffstein:順便說一句,我到現在仍不確定那是不是愚人節玩笑。

Jeff Yan:愚人節已經過去了,我承認那是個玩笑。不過它比大家以為的更接近現實。真正的"笑點"在於:它其實部分是真的。我一直想寫篇後續,這是個很好的提醒 --- --- 錄完這期我就去發。

回到你的直覺,我認為你的判斷方向是對的。一個人在某家公司工作久了,往往會形成偏好;或是在進入時就帶著偏好 --- --- 例如"我學過數學,所以我應當做更酷的機器學習模型、挖掘信號、產出 alpha,這才是關鍵,因為這最難"。這種"只做模型"的思路在大公司或許行得通,因為分工足夠細;但如果你需要把整套業務自行運行起來,僅靠這一點是走不遠的。

你提到的那些"髒活累活" --- --- 吃透 API、補齊文檔缺口、測量各端點延遲 --- --- 非常關鍵。我對高頻交易(乃至許多事情)的理解是:它更像多個因素的乘積,而不是簡單相加。你在不同"桶"裡的投入看似是加總的,但產出往往體現為相乘關係。舉個具體例子:

整體效能≈基礎設施 × 模型。

如果"基礎設施"這一因子只有 1,而"建模"這一因子是 10,那麼在每投入一個單位精力時,理性選擇往往是優先補齊最短板。高頻交易的難點在於:你很難準確判斷這些因子各自處於什麼水平。因此,實踐中需要持續進行"元分析" --- --- 我現在做的,是否確屬最重要的事項?你會很快發現:答案並不顯然。很多競爭優勢,恰恰體現在對優先級的判斷能力上。

在這一意義上,那些看似"髒活"的工作往往至關重要。應當務實地獲取低垂果實,遵循 80/20 原則。行情順暢時,最容易陷入的誤區是:"基礎已經打好,可以去做一些更酷的機器學習研究、追求創新。"我們也曾在這一點上付出代價。並非意味著該方向不存在 alpha,而在於其投入規模大、且邊際回報往往很快遞減。

當你團隊規模較小、現有策略仍然有效、市場機會仍然充沛時,更需要反覆自問並誠實面對:當前最應優先推進的是什麼?不要被表面數據"誘導"去追逐那些暫時不應作為優先項的方向。

Corey Hoffstein:對於希望在加密領域開展高頻交易的人,你曾給出兩條路徑建議:其一是直接在 Binance(幣安)進行交易、並將重心放在 alpha 產生上(我理解這更偏向"主動吃單",而非"掛單做市");其二是選擇一家具有長尾特徵的交易所,深入理解其基礎設施層面的"特性",並據此尋找優勢。能否進一步說明,為何你認為這是兩條最優路徑?二者在方法論上有何差異?

Jeff Yan:這可以類比為一個"鐘形曲線"的直觀結論 --- --- 不要停留在中間。若將鐘形曲線的橫軸理解為不同交易所,那麼問題最突出的往往是中間區間,例如可粗略對應第 2 至第 7 梯隊的平台。

它們的成交量遠小於Binance,但競爭強度與"有毒流量"卻差不多,甚至流量質量可能更差。至少在Binance,我們知道其零售流量占比極高,這會帶來一種"緩衝效應" --- --- 有毒與零售流的混合更友好。頂級HFT公司基本都已經全量接入前若干家頭部交易所(你可以粗略理解為前15名),會用更大規模、更成熟的策略滿負荷交易;你在這些中間梯隊平台裡很難再"榨"出多少收益。如果你願意挑戰可高度擴展的大型CEX策略,就直接從Binance開始,能泛化的也會盡量泛化 --- --- 沒有理由從"中間"起步。

你提到的另一條路也成立:去鐘形曲線最左端。去

最近融資

查看更多
$5M 04-03
$1M 04-02
-- 04-02

近期發行Token

查看更多
03-30
03-23
edgeX EDGE
03-19