我很好奇,AI 現在下圍棋很厲害,請他翻譯跟處理語言也不錯,但防不勝防的新型詐騙,或者洩密行為,究竟要怎麼抓到?

訓練 AI 下圍棋,規則清楚,有輸贏,訓練起來就很厲害。但全新的詐騙方式、全新的洩密行為、全新的駭客侵入方式,要怎麼知道?

看到這本《10 歲開始學 AI》,也講到這個應用,並提到這屬於「非監督式學習」,就認真搜尋並學習了一下,為什麼只給 AI 大量資料,沒有標籤標記,也能夠偵測出洩密行為?

原理是這樣的,台積電給 AI 各種存取資訊,包括誰存取、什麼時候存取、看多久、連線地點、閱覽模式,所有的數位記錄。但是不用告訴 AI 哪些是危險行為。

AI 會自己去閱讀並分類,歸納出多數的行為模式,例如某些資料一般是在下午到晚上被存取,而且閱讀時間偏久。(這可能是需要邊看邊解決問題的文件)某些資料每次一被找到就會被員工下載,線上停留時間都不多。(這可能是跨部門溝通需要填寫的表格)

AI 不知道背後的原因,但他知道大家都這麼做。

所以,他一定也知道,有些文件只有特定等級的人才能閱覽,而且因為只能讀,每一頁的停留時間會有個平均,有的長有的短。

這些行為都可以用統計去歸納,每個動作也都能用統計去算出「出現這樣行為的機率有多大」。

然後,有天一個外面的星巴克 IP 連進來,存取高敏感文件,而且每一頁停留的時間都只有一秒多,一次閱讀數百頁。系統就能立刻知道,這種行為與過往資訊差異過大,於是發出警示。

這就是 AI 能夠做到「訓練時不用告訴他答案,應用時卻又能抓到新犯罪手法」的原理。

這種方式,雖然有可能誤判,但作為篩檢是非常稱職的,尤其對於全新型態的犯罪行為,以前的人沒想過的洩密方式,都有機會第一時間察覺。

各種異常訊號出現後,再由內部安全的員工展開調查,就能進一步確認或排除。

AI 開始普及到現在也沒幾年,雖然說是「10 歲開始學」,但我們這種當爸媽的,好像也可以跟孩子們一起學 😂

書名:10歲開始學AI / 未來出版