AI Arena指南：進階模型與專業技巧

AI Arena 是一款精密的遊戲，它整合了先進的機器學習技術來訓練和優化鬥士模型。玩家可以選擇不同的模型類型，每種模型都提供獨特的優勢和挑戰。這款遊戲強調策略性的數據收集和處理，以提升鬥士的表現，因此玩家必須理解並善用各種可用的設定和模式。

我們有幸與全明星邀請賽冠軍和 G3 代表 Ixtlanian 進行了一次訪談，為 AI Arena 撰寫了一份完整的攻略，內容涵蓋如何成為專業玩家以及在提升遊戲水準之前必須掌握的要點。這是我們系列攻略的第一部分，我們將著重向新玩家介紹進階模型。

鬥士模型

在 AI Arena 中，有三種鬥士模型可供選擇：

簡易型 - 適合新手玩家，且相當受歡迎，但存在限制，無法在高階對戰中發揮。
原創型 - 運用機器學習和精密的工具進行微調，但遊戲玩法可能極具挑戰性。例如，在地圖某處展示一個動作可能會不可預測地影響其他地方的行為。此模型最不受歡迎。
進階型 - 結合了前兩種模型的最佳功能，允許獨立的區域編輯而不影響其他部分，並提供進階設定，將次優數據轉換為有用的訓練材料。此模型受到頂尖玩家的青睞，本文將以此為重點。

選擇進階模型

在開始訓練之前，請選擇「進階」模型以利用本攻略。勾選「指數記憶更新」核取方塊，以進行更有效的近期訓練，這適用於鬥士行為的重大改變。

數據收集流程

遊戲官方 YouTube 頻道提供了大量關於數據收集的影片。以下是來自 Ixtlanian 的一些直接建議：

最小化空資訊槽：縮短按下數據收集按鈕與執行動作之間的暫停時間，以提高訓練效率。
避免不必要的動作：確保在數據收集過程中，每個情境中的動作都清晰且獨立。

數據處理

我們將專注於進階設定而非簡易設定。有關「訓練週期」、「批次大小」、「學習率」以及「方向和動作 Lambda」等設定的詳細說明，請參閱左上角的教學。

給熟悉教學的玩家的提示：

最大變更設定：對於初始訓練階段，使用「訓練週期」和「學習率」的最大值，並結合「批次大小」和「方向和動作 Lambda」的最小值，以建立基本行為。
保護現有數據：使用最大的「方向和動作 Lambda」值來保護現有數據，減少「訓練週期」和「學習率」的值以實現所需的變更，同時保持目前的進度。
移除稀疏性：啟用「移除稀疏性」核取方塊可移除大部分空白資訊格，使訓練更有效。此功能在 95% 的情況下都會使用。
過度取樣：幫助鬥士區分和記憶不同的位置和方向，更精確地回應敵人的動作。此模式通常用於初始訓練以奠定基礎。
多重串流：如果當前訓練中確認，則按比例增加應用現有動作和方向的機會。然而，如果對新動作進行密集訓練，可能會對其他動作產生負面影響。

分區（Buckets）

分區分為兩類：「地面上」和「空中」。在一類中顯示的動作不會影響另一類中的動作，除非被選中。這種隔離是進階模型的一大優勢，受到頂尖玩家的青睞。

地面分區

投射物啟動：僅在特殊能力使用時且鬥士在地面上時啟動。
對手暈眩和對手擊退：分別在對手暈眩或被擊退時觸發。
對手活躍：在鬥士在地面上的所有其他情況下使用，包括所有選項，直到對手暈眩或被擊退。

空中分區

靠近爆炸區、安全區、舞台下方、舞台側面：將空域劃分為鬥士所在的不同區域。這些區域彼此獨立訓練。

AI Arena 中的焦點設定

在選定要進行更改的「分區」後，我們將轉向鬥士應該強調的重點。其中大部分也在遊戲內的教學中有所描述，但我們將專注於最常用的部分，並提供它們在不同組合下的運作提示。

你的動作 - 此設定會記憶鬥士先前的動作，並允許你建立一系列動作。例如，你可以訓練鬥士在升龍拳後執行一次踢頭。它很少使用，主要用於最終訓練階段。
對手動作 - 此設定允許鬥士將自己的動作與對手的動作連結起來。例如，當敵人攻擊時，鬥士可以舉起盾牌，或者當敵人防禦時，鬥士可以抓住敵人。它幾乎總是在地面訓練中從一開始就使用。
你的位置 - 這有助於鬥士理解他們在空間中的位置，以便使用正確的方向或動作。它總是從「舞台側面」和「靠近爆炸區」返回平台時使用，很少在地面上使用。
對手位置 - 這允許鬥士理解對手在空間中的位置。在目前的遊戲環境中很少使用，但可以進行實驗。
你的方向 - 這考慮了鬥士相對於敵人的朝向。它幾乎總是在地面和「安全區」中使用，以追擊敵人並判斷鬥士是否面向敵人或背對敵人。它經常與「與對手的角度」結合使用，並且不適用於從「舞台側面」和「靠近爆炸區」返回平台。提示：僅在你面向敵人時使用此功能來抓住敵人或進行升龍拳。
對手方向 - 這考慮了敵人的朝向，例如只在他們朝你方向攻擊時進行格擋。它與「與對手的角度」結合使用。
與對手的角度 - 這決定了鬥士相對於敵人的位置，並在動作朝向敵人時使用，最常與「你的方向」結合使用。
剩餘恢復次數 - 此設定僅用於從「舞台側面」和「靠近爆炸區」返回。它有助於鬥士理解他們已經使用了哪些技術來返回，從而增加使用其他技術成功返回的可能性。
離散距離 - 這有助於鬥士理解他們是靠近還是遠離敵人，這對於空中垂直戰鬥和所有地面戰鬥都至關重要。它始終用於訓練。
靠近邊緣 - 這有助於鬥士理解他們是在平台邊緣還是中間，從而引入行為的多樣性。掌握它非常重要，並且僅在地面上使用，通常與「離散距離」、「與對手的角度」和「你的方向」結合使用。
對手離開舞台 - 這允許鬥士意識到敵人何時離開平台，以便有效防守邊緣並阻止敵人返回。掌握它非常重要，並且僅在鬥士在地面上時使用，通常與「離散距離」、「與對手的角度」和「你的方向」結合使用。

Ixtlanian 的專業提示

要創造一個適應性強且難以預測的鬥士，請使用各種焦點組合來教授針對不同對手動作的特定行為。這種方法確保你的鬥士能夠快速準確地應對對手的動作，避免可預測性，並在戰鬥情境中變得更加多才多藝。

仔細規劃你的訓練課程，確定你希望鬥士學習的特定技能。在訓練期間展示這些動作，並使用能夠優化其效果的設定來處理數據。例如，如果你的目標是訓練鬥士在近距離空中執行升龍拳或翻踢，並在遠距離跳近進行拳擊，你應該選擇「你的方向」、「與對手的角度」和「離散距離」。這些設定有助於你的鬥士理解他們的視線方向、他們相對於敵人的角度以及他們之間的距離。

最後，務必不斷實驗和迭代。如果訓練結果不盡人意，請不要保存數據。相反，找出問題所在，對訓練或數據處理進行必要的調整，然後再試一次。這種迭代過程將隨著時間的推移提升你的訓練課程，從而培養出反應時間和相關性更優越的鬥士。