預約 Demo

原文連結:掌握資料科學的四大分析步驟,啟動 AI 專案

數位科技的運用,不僅驅動智慧化生活,企業也加快推動數位轉型,人工智慧(AI)的應用更是愈趨廣泛。舉凡語音助理、手機美拍、人臉辨識、個人會行銷,都是日常生活中常見的應用。這些新穎的技術,不只讓生活更方便,也悄悄地影響了多數職場工作者的工作內容。對非電腦科學背景的職場工作者來說,能不能善用人工智慧、與人工智慧協同合作,將是影響未來職場競爭力的關鍵。

不會寫程式,也能做 AI 專案嗎?全球知名資訊科技研究顧問機構 Gartner 近日發佈的一份文章指出,在 2024 年將有 80% 的科技產品與服務出自於非 IT 技術專業人士,這項變革背後最大的推手即是無程式碼工具(No-Code AI tool)。只要瞭解基礎的資料分析流程與原理,運用這類的 AI 建模軟體,即可快速建立 AI 模型。

資料科學專案的分析步驟

以精準行銷的 AI 專案為例:某雜誌擁有大量的訂戶,平時也有經營社群,並且推廣課程。今年推出了一套針對中高階主管的全新的商管課程,希望能夠透過精準投放,提高課程的購買率。然而行銷的總預算有限,在茫茫的會員人群中,要如何篩選出成交機率高的會員,提升效率與利潤,是行銷部門的首要之務。

要達到上述目的,需要打造「潛在客戶名單推薦系統」,作法如下:首先,要將訂戶資料與社群會員資料做整併,進行初步的資料探索。在這個步驟,我們可能發現有少部分客戶的年齡被誤植成負數(資料探索)。為了不影響後續建立模型後的準確率,我們將這幾筆資料予以刪除(資料清理)。接著以 AI 建模軟體建立購課成交率的預測模型(建立模型),再從中選出表現最佳的模型,介接至潛在客戶名單推薦系統,對所有客戶名單進行購課成交率預測,針對成交率高的客戶,進行簡訊或電話行銷(模型部署、實際應用)。

從以上的範例可以發現,資料科學的工作流程大致可以歸納成以下四大步驟:

一、資料探索

對手上的分析繪製簡單的統計圖表,並且觀察個欄位的統計量。其目的在於了解資料的分佈是否與認知相符,查看離群值的分佈,找出關聯性,從圖表找出洞察,建立並測試假說。
在這個步驟,經常查看的統計量有:平均值(Mean)、中位數(Median)、眾數(Mode)、最小值(Min)、最大值(Max)、範圍(Range)、四分位差(Quartiles)、變異數(Variance)、標準差(Standard deviation)。
圖表方面,常見的單變量的圖表有直方圖(Histogram)、柱狀圖(Bar chart);雙變量的圖表則是會看散佈圖(Scatter plot)、箱型圖(Box plot)、熱力圖(Heat map)。

圖說:直方圖可以查看單一欄位的分佈。以此圖為例,訂戶的訂閱期數(subscribe_time)在 50 期以下佔多數。
圖說:訂戶資料長條圖顯示續訂戶約250筆,是新訂戶約60筆的4倍。

二、資料清理

在資料探索階段,可能會發現許多內容不合理的數據,或是遺失值。此時需要仔細檢查為什麼會收到這樣的資料,並針對不同的情境,做出相對應的資料清理動作。
像是發現某些訂戶資料的年齡為負數時,深入去檢查原始資料庫的資料,發現是雜誌社的工作人員登打的時候,將客戶的出生日期打錯了,因此後續才會有有不合理的年齡資訊。此時可以考慮將該筆資料移除,維持資料的正確性。

圖說:從直方圖發現訂戶年齡(age)為負值
圖說:將年齡為負值的資料刪除。

三、建立模型

資料清理完畢之後,只要訓練資料集與演算法之後,即可建立 AI 模型。目前市面上的 AI 建模軟體已經內建 Auto ML 技術,使用者毋須一一調整參數,軟體會自動進行參數最佳化,將最佳的結果回傳。

圖說:將模型的基礎資訊設定完畢,即可自動建立模型。

四、模型部署、實際應用

上述的步驟可以多次反覆執行,建立多個 AI 模型。從中挑選出表現較佳的模型,將之部署上線,開始實際運用到工作場域中。

上述的範例中,行銷人員每月可將新收集到會員資料匯入「潛在客戶名單推薦系統」,系統即回傳成交機率較高的客戶名單。行銷人員即可用這份名單執行後續的促銷活動。

圖說:將 Tukey 模型導入「潛在客戶名單推薦系統」,系統即回傳成交機率較高的客戶名單,提供行銷人員做後續使用。

AI 時代的行銷利器:Tukey

對於行銷、業務人員而言,不外乎想要讓更多人可以認識自家產品,提高潛在客戶的成交意願,進而提升訂單成交率。由 Chimes AI 詠鋐智能所研發的企業級 AI 建模與管理平台 Tukey ,可提供精準投放、商品推薦、挖掘潛在商機、商品銷量預測等各種行銷面向上的決策輔助。

Tukey 的 No-Code AI 產品設計,提供非機器學習演算法專家 (譬如:銀行理財專員、電商營運專員) 簡單直覺的操作介面,讓直接面對營運問題的一線人員,迅速完成 AI 模型建置,提升工作效率。Tukey 也可以完整追溯資料專案的資料歷程,在需要跨部門團隊協作的場合,彌平認知落差,亦可與他人進行跨平台的協同運作,增加工作的一致性與正確性,進而提升工作效率。

Tukey 目前已經被台塑公司採用,並且被納入台灣人工智慧學校的高階經理人班教材。想了解更多,歡迎報名《數位時代》推出的「資料科學概念系列課」!立即打造你的第一個 AI 行銷專案吧!

Enterprise AIMartechNo-Code AI ToolsPredictive Modeling

Chimes AI

Chimes AI 致力於打造 No-Code AI 建模與管理平台,透過數據剖析、行為預測以及流程自動化,協助企業自建 AI 應用,達到 AI 亮點規模化。

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *

Privacy Settings
We use cookies to enhance your experience while using our website. If you are using our Services via a browser you can restrict, block or remove cookies through your web browser settings. We also use content and scripts from third parties that may use tracking technologies. You can selectively provide your consent below to allow such third party embeds. For complete information about the cookies we use, data we collect and how we process them, please check our Privacy Policy
Youtube
Consent to display content from Youtube
Vimeo
Consent to display content from Vimeo
Google Maps
Consent to display content from Google
Spotify
Consent to display content from Spotify
Sound Cloud
Consent to display content from Sound