DataWorks支持PyODPS类型任务
摘要:?昨天,DataWorks推出了PYODPS任務類型,集成了Maxcompute的Python SDK,可在DataWorks的PYODPS節點上直接編輯Python代碼操作Maxcompute,也可以設置調度任務來處理數據,提高數據開發效率。
昨天,DataWorks推出了PYODPS任務類型,集成了Maxcompute的Python SDK,可在DataWorks的PYODPS節點上直接編輯Python代碼操作Maxcompute,也可以設置調度任務來處理數據,提高數據開發效率。
效果如下圖
適用region
只有華東2(上海)region 支持了 PYODPS 節點。
注:底層的 Python 版本為 2.7 。
新建 PYODPS 節點
新建 PYODPS 節點具體操作如下:
1) 單擊數據開發頁面工具欄中的 新建 > 新建任務。2) 填寫新建任務彈出框中的各配置項。
3) 單擊創建
編輯 PYODPS 節點
ODPS入口
DataWorks 的 PyODPS 節點中,將會包含一個全局的變量?odps?或者?o?,即 ODPS 入口。用戶不需要手動定義 ODPS 入口。
執行SQL
PyODPS支持ODPS SQL的查詢,并可以讀取執行的結果。?execute_sql?或者?run_sql?方法的返回值是 運行實例 。
注解:并非所有在 ODPS Console 中可以執行的命令都是 ODPS 可以接受的 SQL 語句。 在調用非 DDL / DML 語句時,請使用其他方法,例如 GRANT / REVOKE 等語句請使用 run_security_query 方法,PAI 命令請使用 run_xflow 或 execute_xflow 方法。
設置運行參數
有時,我們在運行時,需要設置運行時參數,我們可以通過設置?hints?參數,參數類型是dict。
我們可以對于全局配置設置sql.settings后,每次運行時則都會添加相關的運行時參數。
讀取SQL執行結果
運行 SQL 的 instance 能夠直接執行?open_reader?的操作,一種情況是SQL返回了結構化的數據。
另一種情況是 SQL 可能執行的比如?desc,這時通過?reader.raw?屬性取到原始的SQL執行結果。
使用調度參數
PYODPS節點使用調度參數需要注意一下,系統定義的調度參數,可以直接通過此方法獲取。
自定義參數的使用,需要使用單獨的方法獲取。
在全局包括一個?args?對象,可以在這個中獲取,它是一個dict類型。
測試運行結果如下:
請注意:在數據開發下,使用了自定義調度參數,頁面上直接觸發運行PYODPS節點時,需要寫死時間,PYODPS節點無法像SQL一樣直接替換。
調度請參考:https://help.aliyun.com/document_detail/30298.html
文章作者:隱林
原文鏈接
總結
以上是生活随笔為你收集整理的DataWorks支持PyODPS类型任务的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: 阿里云DDoS高防 - 访问与攻击日志实
- 下一篇: 阿里AI界的新伙伴,1秒钟自动生成200