看見未來-AI科技的技術發展與應用

AI 是什麼?

人工智慧(Artificial Intelligence)簡稱AI ,是將目前的電腦科學領域,結合了最新計算機科學與技術以及收集大數據相關資料,讓機器模擬學習類似人類思考方式與自我學習、推論,來試圖預研判情況並嘗試提出解決方案來解決現有問題或輔助決策。

全方位應用領域

人工智慧在醫療、金融、交通、製造和零售等領域都有相當多機會做廣泛的分析預判或執行方面的應用。例如在醫療方面,人工智慧可依據大數據資料庫可提供專業人員治療建議以利加速新藥開發。

而在金融服務中,人工智慧將透過大數據分析與自我學習能來輔助專業人員處理交易和索賠事務,並提供風險管理方案。

人工智慧技術

AI影像辨識技術在視覺處理領域發展迅速,以往過去僅能處理文字,在GPU不斷精進強化,現在能夠精準識別動態影像,也歸功於計算速度提高,擴大了實際應用範圍,並產生了相當多的商機,進而造福社會。

應用領域一

影像辨識技術AI學習三個階段

  • 機器學習階段:
    初期階段是透過將大量資訊輸入資料庫中,讓機器進行訓練分析並執行特定任務,這種技術主要利用統計學的概念,透過演算法來分析數據並做出判斷或預測現實的情況。
  • 深度學習階段:
    在機器學習的中期階段,出現了一個重要的分支技術,利用大量的資訊和演算法,訓練電腦能夠自主學習如何分析並完成特定的指令。此技術的特點在建立相關模型搭配類神經網絡,除了使用統計模型,並且需要強大的硬體來處理龐大資料運算。深度學習的應用領域非常廣泛,其中一個重要的應用就是圖像辨識,經由深度學習,電腦能夠辨識圖像資料,並提供相對應的反應或訊息。
  • 後期階段:
    因影像辨識技術不斷進行自主學習,模仿人類行為包括推理、知識、規劃、學習、交流、感知、移動和操作物體等各個方面,跨越不同領域並嘗試解決更複雜的問題,進行與改進,以提升人們生活和工作的便利與效率。

ADAS技術感知融合

隨著影像辨識技術的精確度的提升,駕駛輔助系統(ADAS)大幅被應用在影像辨識並時時監控路上,自車與其他車輛情況,以記錄前車距離是否過近(跟車系統)、自車是否車道偏離與警示,透過安裝不同功能的感測器於車上,如攝影機、雷達、光達SLAM定位技術、超音波等,並透過感知融合技術以及類神經網絡,讓AI機器學習及深度學習,最後將不同感測的資料進行處理,有效地生成預判取代人眼的視覺感知訊息,並透過分析車輛周遭路況、偵測氣候狀態、光源亮度分布、物件位置、物件型態等,以增加整體車輛行駛的安全性。

ADAS技術感知融合 圖一

應用領域二

應用預判技術 (醫院及長照機構)

  • 復健評估分析:
    透過深度學習,精準分析姿勢與記錄復健進度與狀態,並用科學數據評估復健成效,並提供相關建議給醫護人員, 以減少醫護人員的人力及時間成本。
  •  跌倒偵測:
    偵測到跌倒意外、被照護者因行為異常時,即時通知醫護人員或緊急聯絡人,有效提升危險處理效率,避免二度傷害。

由於透過大量輸入設備建立病患大量相關資料庫,並透過深度學習, 來識別複雜的應用場景並模擬及預判平常行為或是跌倒坐臥姿勢,如下(圖一)類神經網絡結合了多個處理層,如人臉識別、語音,由輸入層(Input Layer)、一個或多個隱藏層(Hidden Layer1/2)和輸出層(Output Layer)組成,每層都使用前一層的輸出作為輸入,因此類神經網絡串至不同層相連。每個類神經網絡都在學習過程中調整,並且隨著權重減少或增加,改變該類神經網路的信號強度。

神經網路 圖二

應用領域三

賣場人流/客戶分析

經由大賣場多處的相關感測器或輸如裝置(價格、產地掃描機)

追蹤商場內顧客的活動,收集和分析大量的數據,包括顧客進出商場的時間、活動區域、停留時間、熱門區域等,經由類神經網絡技術,做深度學習深入瞭解消費者的需求、喜好、行為,透過後臺的大數據讓管理階層快速知道,商品銷售數據與如何做商場動線安排以到最佳場地應用與效益分析記錄。

  • 機器學習:記錄消費者拿起產品以及放下產品的次數,做統計分析。
  • 深度學習:後臺建立大數據分析,訂立商品價格,優惠…等吸引消費者消費,另外也能製訂出優良動線,讓商品曝光度提升增加銷售額。
賣場人流/客戶分析 圖三

應用領域四

AI生成圖片

AI生成人物圖像來自於大量的圖庫,生成過程中間會使用到的內容素材、敘述說明和關鍵字,需要學習理解圖像的特徵和結構,並且根據所學習的訓練模型生成新的圖片,(圖四)生成為人物畫作,圖像將變得更加真實。

 

在機器學習中,收集大量真實人物的圖像數據(包括人物特徵頭髮顏色、眼睛大小、膚色等..),經由這些圖像不同風格和特徵,來訓練AI模型。

 

深度學習對於數據進行預先處理,包括調整圖像大小和裁剪,確保數據在訓練過程中使用的是經過修飾後的圖像。使用者還可以設定一些提示特徵條件,有助於AI系統生成全新人物圖像。為了得到更好的結果,對於圖像顏色和對比度的調整,確保生成的圖像質量和合理性,通常需要多次反覆運算,調整模型的參數,並增加訓練數據量。生成圖像技術可以應用在許多創意和實用的領域,讓AI能夠藉由學習現有數據而產生出全新的創作。

AI生成圖片 圖四

AI未來發展

隨著科技的不斷進步,AI將在各個領域扮演著更重要的角色。醫療領域中AI將為醫生提供相關案例數據提供,能更快速準確的診斷和治療評估,幫助醫療團隊提供更好的醫療服務。在交通領域,AI將推動自動駕駛技術的發展,提高交通效率和安全性。在教育領域,AI將根據學生的學習風格和需求,提供個性化的學習內容和指導,改善教學質量。在環境保護領域,AI將被應用於監測和預測氣候變化,幫助我們更好地保護地球。

 

隨著AI的發展,也需要注重倫理和隱私問題,保護個人的隱私權,以及思考AI的影響和潛在風險評估,制定出相關規範標準。

熱門ChatGPT

什麼是ChatGPT

(Chat Generative Pre-trained Transformer)聊天生成預訓練轉換軟體。自2022年11月OpenAI開發AI聊天機器人程式,以目前的軟體版本GPT-3、GPT-4架構語言模型並以強化學習訓練,在很短時間內已有上億人次的使用者,並且會依據輸入文字自動生成回覆相似的文字和回應不同的問題,以及整理資料翻譯語言或是數學問題求解,程式語言撰寫功能等。

版本

日期

描述

GPT-1

2018年

單向的語言模型,在多領域文本生成和語言理解任務上取得了不錯的效果。

GPT-2

2019年

語言模型資料多,相較於前面版本有更多參數和更深的層次結構,
在各種語言表現出色及文本生成、語言翻譯和文本分類等。

GPT-3

2020年

強大的語言模型,具有眾多參數模型,擁有更深的網絡結構和更高的性能,處理更多的語義並在語言生成、對話系統和自然語言理解表現出色。

GPT-4

2021年

改進模型的性能,增加更多參數和改進模型的理解能力。

(表一) Chat GPT開發時程

ChatGPT應用

透過網路搜尋大數據資訊回覆內容,資訊的正確性與否需要再加上過濾篩選後才能正確提供,無法判斷當下的條件需要是什麼。

  • 缺乏常識和背景知識:ChatGPT的訓練是基於大量文字數據,不具備真正常識和背景知識,在需要深入理解特定領域知識或細節的問題,可能無法提供準確或具體的答案。
  • 語義需要連結上下文理解:會有出現回答不確定的情況,在處理複雜的語義和上下文理解方面仍然存在問題,缺乏真正問題背後的理解能力。
  • 容易受到誤導:大數據訓練來源和模型結構,ChatGPT可能會受到資訊誤導性影響,並產生不正確或是詞不達意的回覆結果。
  • 主動性缺乏:ChatGPT只能回答根據提供的提示和問題生成相應的回答,而缺乏主動性模型能力,它無法主動提出問題或進行主動的對話。
  • 安全和倫理問題:ChatGPT可以生成任意的文字,很有可能使用於不當用途,誤導性的內容散佈假訊息,要嚴格把關監控使用。

儘管有使用上的限制和缺點,ChatGPT仍具高價值有用的工具,可以用於許多不同場景應用。對於關鍵性敏感性的主題,則要篩選過濾驗証,以確保準確性和可靠性。

 

ChatGPT & Google差異

Google強大的搜尋功能瀏覽眾多網頁資訊,再依據相關內容列舉出結果,ChatGPT為使用者搜尋更多的結果,提供使用者的單一解答不需要再去細看其它網站,以目前ChatGPT和Google Workspace在功能和使用方面有所不同,ChatGPT強調語言生成和處理能力,而Google Workspace則提供全面的協作和生態系統,選擇哪一個取決於使用者的具體需求和工作場景。

 

ChatGPT加入Office

ChatGPT融入Office軟體套件,增強功能和整合更方便地與ChatGPT進行互動和使用AI技術來提高工作效率和生產力。

透過指令方式將報告文件匯整成檔案包括畫表格,以及每頁ppt加入動畫方式呈現提供效率完。

以下透過ChatGPT實際應用範例如下(圖四):

ChatGPT實際應用範例 圖五

以上是一個示範性的對話範例,展示了ChatGPT在對話中提供電視推薦的應用能力。請注意,ChatGPT的回答是基於先前訓練的資料庫,並不能保證100%的準確性。在實際應用中,建議使用者仍需參考其它來源和進行進一步的研究,以做出最適合自己的選擇。

 

AI相關產品規劃應用,如下相關產品線可供選擇做為設計應用參考。

  • EPSON 半導體元件(Microcontrollers & ASIC) 機械手臂結合AI技術
    機械手臂搭載視覺系統,在IC料件視覺辨識及高速度、高精度、低震動的移載及分料處理,可透過(Memorence AI)的客製化AI運算降低IC外觀瑕疵檢測誤判率。
EPSON 圖六
  • NVIDIA 產品Server超級電腦,應用於AI人工智慧

隨著數位發展持續擴展,網路使用量大幅增加,人工智慧在大量資料中透過 GPU 加速的應用程式,可用於建立多型態對話式人工智慧服務來提供即時效能,包含預先訓練的對話式人工智慧模型、語音助理和聊天機器人的應用等。

DGX H100 DGX H100
DGX A100 DGX A100

DGX H100:

  1. 8 個 NVIDIA H100 GPU,總 GPU 記憶體高達 640GB每個 GPU 都擁有 18 個 NVIDIA® NVLinks®,提供每秒 900 GB 的 GPU 至 GPU 雙向頻寬
  2. 4 個 NVIDIA NVSWITCH™每秒 7.2TB 的GPU雙向頻寬,比前一代快 1.5倍
  3. 8 個 NVIDIA CONNECTX®-7 和 2 個搭載每秒 400Gb 網路介面卡的 NVIDIA BLUEFIELD® DPU。雙向網路頻寬峰值高達每秒 1TB
  4. 雙 x86 CPU 與 2TB 系統記憶體強大的 CPU,可執行人工智慧技術需求最嚴苛作業
  5. 30TB NVMe SSD使用高速儲存以達到最佳效能

DGX A100:

  1. 18 個 NVIDIA A100 GPU 搭載共 640 GB GPU 記憶體每個 GPU 使用 12 個 NVLink,GPU 至 GPU 頻寬每秒 600 GB
  2. 6個第二代 NVSwitch雙向頻寬每秒 4.8 TB 比前一代高出 2 倍
  3. 10 個 NVIDIA CONNECTX-7 每秒 200GB 網路介面每秒 500 GB 的雙向頻寬峰值
  4. 雙 64 核心 AMD CPU 與 2 TB 系統記憶體核心數量增加 3.2 倍,以驅動最密集的人工智慧工作
  5. 30TB 第四代 NVME SSD每秒 50GB 的頻寬峰值,比第三代 NVME SSD 快 2 倍4 雙 64 核心 AMD CPU 與 2 TB 系統記憶體核心數量增加 3.2 倍,以驅動最密集的人工智慧工作5 30TB 第四代 NVME SSD每秒 50GB 的頻寬峰值,比第三代 NVME SSD 快 2 倍

AI技術不斷進步下,將成為人類生活中不可或缺的一部分,我們將看到智能化的系統,能夠更準確地了解和學習人類語言,並且能夠執行更複雜的任務,如自動化駕駛、智能醫療和智能家居。然而,AI的發展也伴隨著一些挑戰和風險,隨著技術進步,可能會引發關於隱私和數據安全的擔憂。在未來迎接AI技術的新時代,也需要善用AI來解決問題和改善生活質量,以及為我們創造更美好的未來。

參考文獻

1. 人工智慧:定義、好處和應用案例說明, NordVPN, https://reurl.cc/b9ZqDr

2. AI影像辨識技術介紹:從原理到實際應用,教你如何升級場域安防監控!, WATCHSHET, https://reurl.cc/QX1mR0

3. Epson, 茂綸, https://reurl.cc/GAzQ5d

4. 全球首款以 NVIDIA A100 打造的人工智慧系統, NVIDIA, https://reurl.cc/aVpReY

5. 全球使用者首選的企業人工智慧產品, NVIDIA, https://reurl.cc/K0yq9p

You may also want to know