買比特幣 買比特幣
Ctrl+D 買比特幣
ads
首頁 > 非小號 > Info

DIA:深度學習:神經網絡算法的昨天、今天和明天_人工智能

Author:

Time:1900/1/1 0:00:00

原標題:深度學習:神經網絡算法的昨天、今天和明天

2016年,圍棋人工智能軟件AlphaGo打敗了韓國圍棋名將李世石。2017年,新一代AlphaGo的戰斗力升級,又打敗了世界排名第一的柯潔。這樣的人工智能系統,不再簡單地只靠儲存能力戰勝人類,而是已經在一些具體的領域超越了人類的認知,甚至像是擁有了“思考”的能力,更接近大眾對人工智能的想象。人工智能似乎一直是一個遙遠的科幻的概念,但事實上,當今世界很多應用已經達到了“人工智能”的標準。除了前文提到的圍棋軟件,還有自動駕駛系統、智能管家,甚至蘋果手機上的語音助手Siri都是一種人工智能。而這些應用背后的核心算法就是深度學習,也是機器學習領域最火熱的一個分支。和其他機器學習算法有很大不同,深度學習依賴大量數據的迭代訓練,進而發現數據中內在的特征,然后給出結果。這些特征中,有很多已經超越了人為定義的特征的表達能力,因此得以讓深度學習在很多任務的表現上大大超越了其他機器學習算法,甚至超越了人類自己。但是,深度學習還沒能全方面超越人類。相反,它的工作完全依賴于人類對算法的設計。深度學習從誕生到爆發用了大約五十年。從其發展歷程,我們可以窺見計算機科學家們的步步巧思,并從中探討其可能的發展方向。一、什么是深度學習深度學習就是人工神經網絡。神經網絡算法得名于其對于動物神經元傳遞信息方式的模擬,而深度學習這一“俗稱”又來自于多層級聯的神經元:眾多的層讓信息的傳遞實現了“深度”。在動物身上,神經一端連接感受器,另一端連接大腦皮層,中間通過多層神經元傳導信號。神經元之間也不是一對一連接,而是有多種連接方式,從而形成了網絡結構。這一豐富的結構最終不僅實現了信息的提取,也使動物大腦產生了相應的認知。動物的學習過程則需要外界信息在大腦中的整合。外界信息進入神經系統,進而成為大腦皮層可以接收的信號;信號與腦中的已有信息進行比對,也就在腦中建立了完整的認知。類似地,通過計算機編程,計算機科學家讓一層包含參數和權重的函數模擬神經元內部的操作,用非線性運算的疊加模擬神經元之間的連接,最終實現對信息的重新整合,進而輸出分類或預測的結果。針對神經網絡輸出結果與真實結果之間的差異,神經網絡會通過梯度逐層調整相應的權重以縮小差異,從而達到深度學習的目的。二、深度學習的雛形其實,模擬動物的神經活動,并非深度學習的專利。早在1957年,FrankRosenblatt就提出了感知機的概念。這是一種只能分出兩類結果的單層神經網絡。這種模型非常簡單,輸出結果與輸入信息之間幾乎就是一個“加權和”的關系。雖然權重會直接根據輸出結果與真實值之間的差異自動調整,但是整個系統的學習能力有限,只能用于簡單的數據擬合。幾乎與此同時,神經科學界出現了重大進展。神經科學家DavidHubel和TorstenWiesel對貓的視覺神經系統的研究證實,視覺特征在大腦皮層的反應是通過不同的細胞達成的。其中,簡單細胞感知光照信息,復雜細胞感知運動信息。受此啟發,1980年,日本學者福島邦彥提出了一個網絡模型“神經認知機”(圖1)用以識別手寫數字。這種網絡分成多層,每層由一種神經元組成。在網絡內部,兩種神經元交替出現,分別用以提取圖形信息和組合圖形信息。這兩種神經元到后來演化成了重要的卷積層和提取層。但是這個網絡的神經元都是由人工設計而成,其神經元也不會根據結果進行自動調整,因此也就不具有學習能力,只能限制在識別少量簡單數字的初級階段。

國務院辦公廳:推動區塊鏈等技術與醫療服務深度融合:國務院辦公廳發布關于推動公立醫院高質量發展的意見,其中指出推動區塊鏈等新一代信息技術與醫療服務深度融合,建立健全分級分層分流的重大疫情救治體系。推進電子病歷、智慧服務、智慧管理「三位一體」智慧醫院建設和醫院信息標準化建設。大力發展遠程醫療和互聯網診療。推動手術機器人等智能醫療設備和智能輔助診療系統的研發與應用。建立藥品追溯制度,探索公立醫院處方信息與藥品零售消費信息互聯互通。(中國政府網)[2021/6/7 23:17:29]

圖1:神經認知機Neocognitron的工作原理圖

當學習能力無法被實現的時候,就需要更多的人工設計來替代網絡的自主學習。1982年,美國科學家JohnHopfield發明了一種神經網絡,在其中加入了諸多限制,讓神經網絡在變化中保持記憶以便學習。同年,芬蘭科學家TeuvoKohonen在無監督算法向量量化神經網絡的基礎上提出了自組織映射,希望通過縮短輸入和輸出之間的歐氏距離,從繁雜的網絡中學習到正確的關系。1987年,美國科學家StephenGrossberg和GailCarpenter依據自己早先的理論提出了自適應共振理論網絡(Adaptiveresonancetheory),也就是讓某個已知信息和未知信息發生“共振”,從而從已知信息推測未知的信息實現“類比學習”。雖然這些網絡都加上了“自組織”、“自適應”、“記憶”等關鍵詞,但其學習方式效率不高,而且需要根據應用本身不斷地優化設計,再加上網絡的記憶容量很小,很難在實際中應用。1986年,計算機科學家DavidRumelhart、GeoffreyHinton和RonaldWilliams發表了反向傳播算法,才算階段性地解決了神經網絡學習的難題。通過梯度的鏈式法則,神經網絡的輸出結果和真實值之間的差異可以通過梯度反饋到每一層的權重中,也就讓每一層函數都類似感知機那樣得到了訓練。這是GeoffreyHinton第一個里程碑式的工作。如今的他是Google的工程研究員,曾獲得計算機領域最高榮譽的圖靈獎。他曾在采訪中說:“我們并不想構建一個模型來模擬大腦的運行方式。我們會觀察大腦,同時會想,既然大腦的工作模式可行,那么如果我們想創造一些其他可行的模型,就應該從大腦中尋找靈感。反向傳播算法模擬的正是大腦的反饋機制。之后的1994年,計算機科學家YannLeCun在GeoffreyHinton組內做博士后期間,結合神經認知機和反向傳播算法,提出了用于識別手寫郵政編碼的卷積神經網絡LeNet,獲得了99%的自動識別率,并且可以處理幾乎任意的手寫形式。這一算法在當時取得了巨大的成功,并被應用于美國郵政系統中。三、深度學習的爆發盡管如此,深度學習并沒有因此而熱門。原因之一,就是神經網絡需要更新大量參數,需要強大的數據和算力的支持(圖2)。而如果想通過降低網絡的層數來降低數據量和訓練時間,其效果也不如其他的機器學習方法。2006年GeoffreyHinton的另一篇論文首度使用了“深度網絡”的名稱,為整個神經網絡的優化提供了途徑。雖然為后面深度學習的炙手可熱奠定了基礎,但是之所以用“深度網絡”而避開之前“神經網絡”的名字,就是因為主流研究已經不認可“神經網絡”,甚至到了看見相關標題就拒收論文的程度。深度學習的轉折發生在2012年。在計算機視覺領域,科學家也逐漸注意到了數據規模的重要性。2010年,斯坦福大學的計算機系副教授李飛飛發布了圖像數據庫ImageNet,共包含上千萬張經過人工標記過的圖片,分屬于1000個類別,涵蓋動物、植物、生活等方方面面。2010—2017年,計算機視覺領域每年都會舉行基于這些圖片的分類競賽,ImageNet也因此成為全世界視覺領域機器學習和深度學習算法的試金石。2012年,GeoffreyHinton在多倫多大學的學生,AlexKrizhevsky,在ImageNet的分類競賽中,通過在兩塊NVIDIA顯卡上編寫神經網絡算法而獲得了冠軍,而且其算法的識別率大幅超過第二名。這個網絡隨后被命名為AlexNet。這是深度學習騰飛的開始。

中國工程院院士:區塊鏈產業發展需要深度挖掘其價值:中國工程院院士張平表示,區塊鏈技術是非常有價值、有前景的一種應用技術,在新一輪的區塊鏈發展浪潮下,區塊鏈的產業發展更需要厘清相關問題、深度挖掘其存在和發展的價值,更好地為城市的經濟產業發展做出更大貢獻。(南京晨報)[2020/6/19]

圖2:AlexNet的網絡結構

從AlexNet開始,由ImageNet提供數據支持,由顯卡提供算力支持,大量關于神經網絡結構的研究逐漸鋪開。首先,由于大量軟件包的發布,實現深度學習變得越來越容易。其次,在研究領域,從ImageNet分類競賽和任務為更加復雜的圖像分割和描述的COCO競賽中,又產生了VGGNet、GoogLeNet、ResNet和DenseNet。這些神經網絡的層數逐漸增加,從AlexNet的11層到VGGNet的19層,而到ResNet和DenseNet時,深度已經達到了150層乃至200層,達成了名副其實的“深度”學習。這些深度神經網絡在一些數據集上關于分類問題的測試,甚至已經超過了人類的識別準確率。如表1所示:

表1:歷年ImageNet圖片分類比賽優秀網絡匯總

自此,計算機科學家們越來越多地利用神經網絡算法來解決問題。除了上述在二維圖像上的分類、分割、檢測等方面的應用,神經網絡還被用在時序信號甚至是無監督的機器學習中。循環神經網絡可以按照時間順序接受信號的輸入。一方面,它的每層神經元可以壓縮并儲存記憶;另一方面,它可以從記憶中提取有效的維度進行語音識別和文字理解。而把神經網絡用在無監督學習上,就跳出了“提取主成分”或者“提取特征值”的窠臼,簡單地用一個包含了多層網絡的自編碼器,就可以把原始信息自動地實現降維和提取。再結合向量量化網絡,可以實現對特征的聚類,進而在沒有太多標記數據的情況下得到分類結果。可以說,神經網絡無論是效果還是應用范圍上,都成為了無可爭議的王者。四、深度學習的發展現狀和趨勢2017年,ImageNet圖像分類競賽宣布完成了最后一屆。但這并不意味著深度學習偃旗息鼓,恰恰相反,深度學習的研究和應用脫離了之前以“分類問題”為研究主題的階段,進入了廣泛發展的階段。同時,與深度學習相關的國際會議投稿量逐年呈指數式地增加,也說明有越來越多的研究者和工程師投身于深度學習算法的研發和應用。筆者認為,深度學習近年來的發展呈現出以下幾個趨勢。第一,從結構上看,神經網絡的類型會變得更加多樣。其中,可以執行卷積神經網絡逆向過程的生成對抗網絡從2016年被提出以來發展迅速,成為了深度學習一個重要的“增長點”。由于深度學習算法可以從原始信息中提取特征,那么其逆過程邏輯上也是可行的,即利用一些雜亂的信號通過特定神經網絡來生成相應的圖像。于是,計算機科學家IanGoodfellow提出了生成對抗網絡。這個網絡除了能生成圖像的生成器之外,還提供了一個判別器。在訓練過程中,生成器趨于學習出一個讓計算機難以分辨的、極度逼近真實的生成圖片,判別器趨于學習出強大的判定真實圖片和生成圖片的能力。二者對抗學習,生成圖片做得越真實,判別器就會越難分辨;判別器能力越強,也就促使生成器生成新的、更加真實的圖片。生成對抗網絡在人臉生成和識別、圖像分辨率提升、視頻幀率提升、圖像風格遷移等領域中都有著廣泛的應用。第二,研究的問題趨于多樣。一方面,一些在機器學習其他分支中的概念,如強化學習、遷移學習,在深度學習中找到了新的位置。另一方面,深度學習本身的研究也從“工程試錯”向“理論推導”發展。深度學習一直因其缺少理論基礎而飽受詬病,在訓練過程中幾乎完全依賴數據科學家的經驗。為了減少經驗對結果的影響,以及減少選擇超參數的時間,除了對最初經典網絡結構的修改,研究者們也在從根本上修正深度學習的效率。一些研究者在試圖聯系其他機器學習的方法,用以使深度學習從工程的試錯變為有理論指導下的實踐。還有一些研究在試圖解釋深度學習算法的有效性,而不只是把整個網絡當做一個黑盒子。與此同時,研究者也在針對超參數建立另一個機器學習的問題,即元學習,以降低選擇超參數過程的難度和隨機性。第三,隨著大量研究成果的新鮮出爐,更多的算法也被應用于產品中。除了一些小規模的公司陸續開發了圖像生成小程序,大公司們也在競相搶占深度學習這一高地。互聯網巨頭Google、Facebook和Microsoft都先后成立了深度學習的發展中心,中國的互聯網公司百度、阿里巴巴、騰訊、京東以及字節跳動等也都各自成立了自己的深度學習研究中心。一些基于深度學習技術的獨角獸公司,如DeepMind、商湯、曠視等,也從大量競爭者中脫穎而出。2019年以來,產業界的深度學習研究也漸漸地從關注論文發表轉變到了落地的項目。比如騰訊AILab對視頻播放進行優化,比如依圖制作的肺結節篩查已經在國內的一些醫院試點。第四,隨著5G技術的逐漸普及,深度學習會跟云計算一起嵌入日常生活。深度學習這項技術一直難以落地的原因是計算資源的匱乏。一臺配備顯卡的超級計算機的成本可以達到50萬人民幣,而并不是所有公司都有充足的資金和能夠充分使用這些設備的人才。而隨著5G技術的普及,以及云技術的加持,公司可以通過租用的方式,低成本地從云中直接獲得計算資源。公司可以將數據上傳到云端,并且幾乎實時地收到云端傳回的計算結果。一大批新興的創業公司正在想辦法利用這些基礎設施:他們召集了一批計算機科學家和數據科學家,為其他公司提供深度學習算法支持和硬件支持。這使得一些之前跟計算機技術關系不大的行業,不再需要自己定義問題、研發方案,而是通過與算法公司合作便利地享受到計算機技術行業的專業支持,也因此更容易獲得深度學習的賦能。五、總結與討論在五十多年的歷程中,深度學習經過了從雛形到成熟、從簡單到復雜的發展,在學術界和業界積累了大量理論和技術。現在的發展方向趨向于多元化。這一方面是因為大量產品正處于研發階段,另一方面計算機科學家也在做一些關于深度學習的更加細致的研究。當然,作為一個綜合性的學科,除了以圖像識別為核心的發展歷程,深度學習在語音分析和自然語言處理上也有其各自的發展過程。同時,多種神經網絡、多媒體形態的結合,正在成為研究的熱點。比如結合圖像和語言處理的自動給圖片配字幕就是一個具有挑戰的課題。需要指出的是,神經網絡的實現并非只有上述這一種方法,一些現階段沒有得到廣泛使用的網絡結構,比如如自適應共振理論網絡、Hopfield網絡以及受限玻爾茲曼機也可能在未來提供整個行業的前行動力。可以肯定,雖然現在深度學習還是一個似乎縈繞著高級和神秘光環的存在,但在不久的將來,這件超級武器將會成為大小公司的基本技術。

Filenet基金會與飛貓Fmall交易平臺達成深度戰略合作:近日,Filenet基金會宣布與飛貓Fmall交易平臺達成深度戰略合作,雙方將在飛貓創世公投、市場運作以及分布式存儲深度研究等多個方面達成合作。據了解,Filenet致力于存儲分發有價值的內容,以挖礦的形式,獎勵礦工貢獻閑置帶寬以及存儲空間。[2020/6/18]

動態 | 中軟國際教育科技集團、CoinDesk中文及Omni規范委員達成深度合作:近日,中軟國際教育科技集團、CoinDesk中文以及Omni規范委員會三方,就Omni中國區塊鏈人才認證培訓計劃達成深度戰略合作。Omni區塊鏈人才認證將由中軟國際教育科技集團與Omni聯合發行,涵蓋了全面的理論和應用,包括區塊鏈基礎理論,分布式數據庫基礎理論,通用區塊鏈系統實操,深度技術能力實操等等。中軟國際教育科技集團將提供滿足考試大綱的完整教程和培訓。通過Omni認證,三方致力于把最新的技術引入中國社區,本次合作的三方將利用各自品牌、渠道、技術優勢,在課程設計、教材制定、考試編制等培訓認證所需的各環節通力合作。[2020/1/14]

聲音 | 人民法院報:區塊鏈等固證存證手段在司法領域深度運用:今日,人民法院報刊文指出,智慧法院建設給司法帶來深刻變化。如互聯網訴訟平臺建設,包括在線訴訟的當事人身份認證、在線立案、在線庭審、電子證據認證、電子送達、電子簽名、電子筆錄、電子檔案等,其中運用可信時間戳、哈希值校驗、區塊鏈等固證存證手段都表明了前沿技術在司法領域的深度運用。[2018/11/1]

Tags:人工智能tronDIA人工智能技術應用學人工智能后悔死了人工智能考研考哪些科目tron幣是什么幣DIA幣是什么幣

非小號
COV:學術頭條:母親抑郁使后代抑郁幾率增加70%,2100年海岸洪水威脅20%全球GDP,強生新冠疫苗動物實驗結果優異_SAR幣SARS價格

強生新冠疫苗動物實驗結果優異:接種一次即可激發強力的中和抗體和細胞免疫反應7月30日,強生公司宣布,該公司開發的主打新冠病疫苗在臨床前研究中取得積極結果.

1900/1/1 0:00:00
300:“孤獨的女王”柴智屏,捧紅F4、陳妍希、柯震東,卻眾叛親離_狗狗幣能漲到300美元嗎

主持人胡瓜曾這么評價"偶像劇教母"柴智屏:"她很有一股武則天、慈禧太后的氣勢。" 柴智屏1962年出生在臺灣,20歲時母親過世,30歲時父親,作為家中的獨女,電視機是她從小到大的陪伴.

1900/1/1 0:00:00
300:貴州建設全國唯一的“省部共建”辣椒專業批發市場_小硬幣歷險記300

全國唯一!究竟有怎樣的實力?從獨特的自然條件到有力的政策支持,從雄厚的科技力量到先進的發展模式,從四通八達的交通到全國性的交易集散地,還有以“老干媽”為龍頭的完整的辣椒產業鏈.

1900/1/1 0:00:00
EGO:新款樂高蘭博基尼Sian限量版3,696個零件約3072人民幣_LEG

新款樂高蘭博基尼SianFKP37的1:8比例將從6月開始發行 在蘭博基尼西安FKP37是最新的超級跑車,以獲得樂高待遇.

1900/1/1 0:00:00
CRO:高瓴醫藥布局屢結碩果,投出2.5萬億元總市值后仍在創造紀錄_CEO價格CRO幣

來源:時刻頭條 高瓴或將創造又一個紀錄。北京時間2020年7月13日,百濟神州宣布向特定現有投資者以注冊直接發行的方式發行145,838,979股,每股普通股以14.2308美元的購買價出售,相.

1900/1/1 0:00:00
數字人:人民數字化與虛擬貨幣不是一個事!還分不清的速看!_數字貨幣交易所官方網址

隨著科學技術的快速發展,人們的生活方式發生了日新月異的變化,科技給我們帶來不一樣的生活體驗。其中我們的交易“支付手段”也在近些年發生極大的轉變。二維碼支付更是被譽為“中國新四大發明”之一.

1900/1/1 0:00:00
ads