使用 Google Dataproc 建立 Spark 機器學習模型
程式碼研究室簡介
subject上次更新時間:10月 12, 2022
3. 建立並連結 Vertex AI Workbench 執行個體
在本節中,您將建立 Vertex AI Workbench 執行個體。然後進行連線、複製 GitHub 存放區並執行筆記本。
如要建立 Vertex AI Workbench 執行個體,請按照操作說明操作,或按照以下步驟操作。
- 前往「Managed Notebooks」(代管筆記本) 控制台頁面。
- 按一下「新增筆記本」。
- 提供名稱並選擇區域,例如 us-central1 (愛荷華州)。理想情況下,這應與先前在程式碼研究室中選取的區域相符,但並非強制規定。
- 在「權限」下方選取「僅限單一使用者」。
- 開啟「進階設定」下拉式選單。
- 在「安全性」下方,依序選取「啟用 nbconvert」和「啟用終端機」。
- 按一下 [建立]。
執行個體應該會在五分鐘內佈建完成。執行個體準備就緒之後,「筆記本名稱」旁會顯示綠色勾號。
執行個體準備就緒之後,按一下「開啟 JUPYTERLAB」。在系統提示時進行驗證,並啟用所有權限。
4. 從筆記本使用 Spark ML 建構模型
載入 JupyterLab 執行個體後,您位於「啟動器」分頁中。在這個分頁中,按一下「Other」(其他) 下方的「Terminal」(終端機),即可開啟新的終端機。
在終端機中,複製 Vertex AI 範例存放區。
git clone https://github.com/GoogleCloudPlatform/vertex-ai-samples.git
在「File Browser」(檔案瀏覽器) 分頁中,前往 vertex-ai-samples/notebooks/Official/workbench/spark。按兩下筆記本 spark_ml.ipynb 來開啟筆記本。系統提示您選取核心時,請選取「Python (local)」。
一邊執行各個儲存格,一邊執行筆記本的各個步驟。請按照儲存格中的指示操作。