人工智能遇到文件和人員障礙:數字化和數字化

2020-06-24 13:01:40    來(lái)源:新經(jīng)網(wǎng)    作者:馮思韻

人工智能已經(jīng)得到了驚人的應用,為識別,模式和異常檢測,預測分析,自治系統,超個(gè)性化和目標驅動(dòng)系統提供了強大的功能。但是,如果不訪(fǎng)問(wèn)數據來(lái)訓練機器學(xué)習模型,人工智能系統將無(wú)法做任何事情。而且,大部分數據都以紙質(zhì)或電子形式或人工控制的形式鎖定在文檔中。

通常,實(shí)現任何AI項目的必要的第一步就是簡(jiǎn)單地將這些文檔和流程從紙本和基于人的形式中提取出來(lái),并轉換成機器可以理解的數字形式。將這些模擬資產(chǎn)轉換為數字形式的概念在文檔和信息的上下文中稱(chēng)為數字化,在流程和基于人的活動(dòng)的上下文中稱(chēng)為數字化。根據分析公司Cognilytica的報告,毫不奇怪,數字化和數字化工作正在A(yíng)I支持系統的背景下看到了一些最強勁的活動(dòng)。

數字化

數字化的總體思路是將信息轉換為計算機可讀的數字格式的過(guò)程。為了從您的數據和信息中獲得真正的見(jiàn)解,它需要以數字格式而不是紙質(zhì)形式并存儲在物理文件柜中。數據是收集信息,理解和見(jiàn)解的基礎層。文檔數字化是將計算機無(wú)法處理的信息獲取為可以處理的格式的想法。

通過(guò)數字化數據,組織和機構可以從資產(chǎn)中獲取更多價(jià)值,而這些資產(chǎn)實(shí)際上是在收集灰塵并占用空間。為了從包括執行分析,自動(dòng)執行各種任務(wù)以及合并更多智能和認知過(guò)程的數據中獲得更高層次的理解,信息需要從非數字形式轉換為計算機可以理解的形式。

數字化信息的示例包括:

將印刷文本和手寫(xiě)文本轉換為數字格式

將模擬格式的音頻記錄轉換為數字格式

將檔案文件轉換為數字格式

將視頻和電影內容轉換為數字格式

對于與文檔有關(guān)的信息,文檔數字化的概念也稱(chēng)為文檔捕獲。 文檔捕獲和文檔數字化的目標是獲取非數字信息并將其以數字方式表示以進(jìn)行進(jìn)一步處理之一。許多文檔捕獲系統會(huì )獲取數字圖像或打印文檔,視頻,膠片或其他非數字資產(chǎn)的樣本。然后可以將生成的數字格式電子存儲以進(jìn)行進(jìn)一步的處理和分析。以下是文本數字化的示例。

人工智能遇到文件和人員障礙:數字化和數字化

正如文檔可以數字化一樣,音頻和視頻資產(chǎn)也可以數字化。模擬視頻或音頻必須轉換為數字格式,組織才能以有意義的方式使用它,例如發(fā)布到Internet或網(wǎng)站上,或通過(guò)電子郵件或數字文件共享傳輸給某人。

音頻和視頻數字化的示例包括:

將電影和磁性視頻轉換為數字格式

將音樂(lè )和磁性音頻轉換為數字格式

將模擬音頻和視頻制作轉換為數字格式

一旦捕獲到文檔,便可以對其進(jìn)行進(jìn)一步處理和分析,以獲取更多價(jià)值。除簡(jiǎn)單的掃描和存儲外,后處理活動(dòng)還涉及內容分析和文檔處理,包括以下內容:

光學(xué)字符識別(OCR),用于識別打印的文本并將其轉換為機器文本表示形式

智能字符識別(ICR),可以處理手寫(xiě),手寫(xiě)標記(例如首字母縮寫(xiě)),劃線(xiàn)和手工填寫(xiě)的自由格式信息。

光學(xué)標記識別(OMR)識別有意義的文本或手寫(xiě)指示,例如打勾的復選框,填充的氣泡和其他指示標記,這些標記在自動(dòng)評分,考試處理,選舉投票等方面很有用。

光學(xué)條形碼識別(OBR),可以識別條形碼,索引和其他標記以實(shí)現高速數據收集。

數字化與數字化

通過(guò)解決以前依賴(lài)于非數字信息的過(guò)程,數字化擴展了數字化的思想。數字化專(zhuān)注于捕獲以前基于非數字信息的過(guò)程,并以數字為中心的方式對其進(jìn)行編碼。下圖顯示了數字化,數字化和數字轉換之間的區別。

人工智能遇到文件和人員障礙:數字化和數字化

數字化流程使公司和政府都可以增強服務(wù),節省資金并改善公民的生活質(zhì)量。在銀行,抵押和保險行業(yè)中向數字簽名的轉變?yōu)榱鞒虜底只峁┝艘粋€(gè)很好的例子。稅收文件的電子歸檔和數字銀行及移動(dòng)銀行支票掃描的發(fā)展是通過(guò)使用數字文件交換實(shí)現了數字化處理的其他示例。

數字化的示例包括:

將現有的基于人員和文檔的工作流“捕獲”為這些工作流的基于計算機的表示形式,以便以后進(jìn)行自動(dòng)化或分析

現有的基于人的流程的自動(dòng)化

可以提供工作流程步驟的有效性和效率的可見(jiàn)性的過(guò)程分析和過(guò)程管理工具

將高級分析和增值技術(shù)應用于基于文檔的多步驟交互

以前手動(dòng)進(jìn)行的流程的改進(jìn)以信息的數字交換(即數字簽名)為中心

處理紙質(zhì)流程和基于人的流程向數字流程的一種方法是捕獲和自動(dòng)化現有流程。機器人流程自動(dòng)化(RPA) 技術(shù)在這里具有優(yōu)勢,它可以通過(guò)計算機接口獲取以前需要手動(dòng)操作的現有流程,并將其轉換為完成重復任務(wù)的基于軟件的自動(dòng)化流程。盡管RPA解決方案的主要目的不是修改現有工作流程,但它們確實(shí)有助于從公式中刪除人為因素,從而使這些流程更加高效。

除了流程自動(dòng)化之外,希望將流程數字化的公司還可以使用流程挖掘和發(fā)現軟件來(lái)分析現有工作流程,深入了解改進(jìn)和提高這些工作流程的機會(huì ),并在基于人的工作流程中添加更多的監視和管理功能存在。這些“ 流程捕獲 ”工具能夠將現有的基于人的工作流記錄和記錄為機器可理解的格式,以供以后進(jìn)行自動(dòng)化或分析。

數字化與數字化轉型之間的關(guān)系

除了數字化和數字化的概念外,還有一個(gè)經(jīng)常被包裹和混淆的術(shù)語(yǔ):數字轉換。數字化轉型是一個(gè)廣泛的想法,已經(jīng)存在了幾十年。數字化轉型的概念是組織運營(yíng)的戰略和根本變革,以數字化流程,技術(shù)和方法為驅動(dòng)力,以實(shí)現高效率和高運營(yíng)率。具有遠見(jiàn)卓識的組織正在利用計算,存儲和軟件技術(shù)的巨大進(jìn)步來(lái)數字化其員工隊伍,并在此過(guò)程中實(shí)現顯著(zhù)的生產(chǎn)力,節省時(shí)間并提高公民或客戶(hù)滿(mǎn)意度。

數字化轉型基于數字信息(數字化)和數字過(guò)程(數字化)的基礎。它基于這些來(lái)改變操作的本質(zhì),從而超越了簡(jiǎn)單地存儲更多數據并通過(guò)向其策略添加智能來(lái)使現有系統和流程自動(dòng)化的功能,并使認知技術(shù)的力量能夠應對其工作環(huán)境中更為復雜的挑戰,簡(jiǎn)單的自動(dòng)化將無(wú)法實(shí)現。成功實(shí)現數字化運營(yíng)的組織減少了客戶(hù)和利益相關(guān)者需求之間的摩擦,并降低了組織有效滿(mǎn)足這些需求的能力。

數字化是許多AI項目必不可少的第一步

乍一看,數字化似乎與AI無(wú)關(guān)。但是,數字化是從鎖定在非數字資產(chǎn)或基于人的過(guò)程中的數據中提取價(jià)值的必要的第一步。通過(guò)首先對流程和文檔進(jìn)行數字化然后再數字化,可以將更大的價(jià)值應用于業(yè)務(wù)組織,從而使它們能夠解決越來(lái)越困難,業(yè)務(wù)價(jià)值越來(lái)越高的業(yè)務(wù)問(wèn)題。沒(méi)有數字化的基礎層,組織就無(wú)法應用AI和ML等高級技術(shù)來(lái)獲取附加價(jià)值。畢竟,數據是收集信息,理解和見(jiàn)解的基礎層。

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如作者信息標記有誤,請第一時(shí)間聯(lián)系我們修改或刪除,多謝。