平板掃描儀在正在逐漸的淡出人們的視野。它們正在被智能手機和相關的應用程序所取代,這些應用程序正在成為桌面設備的成熟替代品。使用移動掃描實現(xiàn)流程自動化對于各種規(guī)模的企業(yè)來說更具成本效益,即使對于小企業(yè)來說也是負擔得起的。當然,您可以簡單地通過使用智能手機相機拍照,但您最終會得到一張帶有不必要背景和額外偽影的照片。
在這種情況下,理想的解決方案是運行在人工智能上的移動掃描應用程序。為什么質(zhì)量掃描如此重要?即使在最困難的條件下,人工智能也有助于確定文檔邊界并進行完美掃描。用戶很少考慮會影響掃描結(jié)果的因素。透視變形、光照、顏色和背景紋理——我們 可以在神經(jīng)網(wǎng)絡的幫助下解決所有這些問題。這有助于用戶在 2 秒內(nèi)自動進行掃描,而不是手動選擇文檔,這需要 5-6 秒以上。
應用程序中的神經(jīng)網(wǎng)絡 :當前的挑戰(zhàn)和對該領域的期望。在應用程序中實現(xiàn)神經(jīng)網(wǎng)絡的最大挑戰(zhàn)是資源。最先進的算法需要大量的計算能力,而移動設備有時甚至無法加載這些算法。這個問題有兩種解決方案:在云中運行網(wǎng)絡并通過 Internet 向用戶提供結(jié)果。使用適合移動設備的特殊網(wǎng)絡并在設備本身上運行。
第一個解決方案更昂貴,因為它需要應用程序發(fā)布者租用服務器。此外,它僅在 Internet 可用時才有效。但是,它使我們能夠為用戶提供最現(xiàn)代且資源消耗最少的算法,而不管硬件如何。
至于第二種解決方案,它要求我們考慮與我們的應用程序兼容的最古老的設備,并開發(fā)可以與它們一起使用的特殊網(wǎng)絡。
這些解決方案都不是最佳選擇。如果您需要盡可能高的準確性,或者如果算法過于耗費資源,那么第一個選擇就是要走的路。如果您需要一個運行良好且不需要 Internet 連接的解決方案,請選擇第二個。您甚至可以通過在設備上運行網(wǎng)絡的一部分和在云中運行另一部分來將這兩者合二為一。
在不久的將來,我們的手機將變得更加強大,深度學習研究人員將開發(fā)更高效的神經(jīng)網(wǎng)絡架構(gòu),使我們能夠在移動設備上運行該領域的一些最佳算法。我們還將能夠使用最好的云 GPU,并通過 5G 將結(jié)果發(fā)送給用戶。所有這些都將使用戶體驗完美無缺。
移動應用對神經(jīng)網(wǎng)絡技術(shù)的市場需求是什么?
對于中小型企業(yè)來說,提高效率和優(yōu)化成本的需求仍然是首要任務(而且這一趨勢每年都在增加)??焖賿呙栉臋n、支票和收據(jù)的需求仍然存在,但我們手頭并不總是有平板掃描儀。此外,重要的是進行沒有缺陷的高質(zhì)量掃描,這對于基于訓練有素的神經(jīng)網(wǎng)絡的移動掃描儀來說是一項容易的任務。
現(xiàn)在,當人們離開設備齊全的工作場所時,使用文件進行遠程工作的問題變得相當?shù)念l繁。因此,一個允許企業(yè)家有效組織遠程工作并在幾次點擊中發(fā)送高質(zhì)量文檔的移動應用程序?qū)ζ髽I(yè)來說是有價值的。
人工智能掃描移動應用程序不僅被企業(yè)家用。此類應用程序的目標受眾包括來自各個領域的用戶:在旅途中工作的人(記者、醫(yī)務人員、推銷員)、學生(不僅需要掃描,還需要在手機上快速編輯文檔,然后通過信使發(fā)送給老師)、學校教師和大學教授。
神經(jīng)網(wǎng)絡上運行的移動應用程序有什么獨特之處?
應用程序最困難的任務是確定用戶究竟想要掃描什么。這一切都始于圖像中文檔的正文和邊框的定義。大多數(shù)掃描應用程序無法準確、自動地檢測邊界,或者在此過程中犯了很多錯誤。例如,找出表格的開始位置和文檔的結(jié)束位置并非易事。如果紙張放在白色桌子上,或者通常情況下放在一堆文件上,情況只會變得更加復雜。這就是人工智能來拯救的地方。
如今,使用手機在幾秒鐘內(nèi)獲得高質(zhì)量掃描文檔的需求已成為新世界的現(xiàn)實。因此,應用程序開發(fā)人員不僅應該考慮提高掃描質(zhì)量,還應該考慮人工智能應用程序的附加功能,因為將掃描應用程序轉(zhuǎn)變?yōu)槎喙δ芷脚_的趨勢很明顯。