彩神网推荐《火爆四肖中特》
用戶名: 密碼: 驗證碼:

康寧:人工智能及其對數據中心的影響

摘要:人工智能是如何影響數據中心的呢?早在2014年,Google就在他們的一個數據中心部署了Deepmind AI(使用人工智能的一種應用——機器學習)。結果呢?他們能夠持續地減少40%用于冷卻的能量,這相當于在考慮到電氣損耗和其他非冷卻效率之后,總PUE開銷減少15%。這產生了該數據中心見過的最低PUE。基于這些顯著的節省,Google希望在他們的其他數據中心里部署這項技術,并建議其他公司也這樣做。

  這可能有助于發現新的效率水平,伴隨的是帶寬需求的大幅增加   Tony Robinson, Corning

  ICCSZ訊 電影制作人如何能夠將那些在當時看來與現實相去甚遠的概念引入我們的日常生活中,這一點一直讓人感到驚奇。1990年,阿諾德施瓦辛格(Arnold Schwarzenegger)的電影《Total recall》向我們展示了“Johnny Cab”,這是一種無人駕駛汽車,可以載著我們去任何想去的地方。現在,大多數大型汽車公司都在投資數百萬美元將這項技術推廣到大眾。多虧了《回到未來2》(Back to the Future II),馬蒂·麥克弗萊(Marty McFly)在磁浮滑板上躲避暴徒,可以讓我們的孩子們站在類似于1989年我們看到的東西上撞向家具(以及彼此)。

  回到1968年(我們有些人還能記得),我們用HAL 9000(電影《2001太空漫游》中發現號宇宙飛船上的一臺有感知的計算機)接觸到了人工智能(AI)。HAL能夠說話和面部識別,自然語言處理,唇讀,藝術欣賞,解釋情感行為,自動推理,甚至可以下棋。

  快進到過去幾年,您可以非常快速的確定AI已經成為我們日常生活中不可或缺的一部分。您可以向智能手機詢問下一個旅行目的地的天氣情況,虛擬助理可以播放您喜歡的音樂,您的社交媒體賬戶將根據您的個人喜好更新新聞和廣告。 沒有冒犯科技公司的意思,這就是AI 101。

  但是在這個背景下發生的事情太多了,我們看不到這有助于改善,甚至拯救生活。語言翻譯、新聞推送、面部識別、復雜疾病的更準確診斷以及藥物研發速度的加快,只是企業開發和部署人工智能的部分應用。據Gartner預測,人工智能帶來的商業價值到2022年將達到3.9萬億美元。

  縝密思考的服務器

  那么人工智能是如何影響數據中心的呢?早在2014年,Google就在他們的一個數據中心部署了Deepmind AI(使用人工智能的一種應用——機器學習)。結果呢?他們能夠持續地減少40%用于冷卻的能量,這相當于在考慮到電氣損耗和其他非冷卻效率之后,總PUE開銷減少15%。這產生了該數據中心見過的最低PUE。基于這些顯著的節省,Google希望在他們的其他數據中心里部署這項技術,并建議其他公司也這樣做。

  Facebook的使命是“賦予人們建立社區的力量,讓世界更緊密地聯系在一起”,他們在白皮書《Facebook應用機器學習:數據中心基礎設施的視角》(Applied Machine Learning at Facebook: A Datacenter Infrastructure Perspective)中概述了這一點。它描述了在全球范圍內支持機器學習的硬件和軟件基礎架構。

  為了讓你對AI和ML需要多少計算能力有個基本概念,百度硅谷實驗室的首席科學家Andrew Ng表示,訓練一個百度的中文語音識別模型不僅需要4 terabytes的訓練數據,還需要20個計算機的exaflops計算量,也就是整個培訓周期內需要200億億次數學運算。

  但是我們的數據中心基礎設施呢?人工智能是如何影響不同規模和類型基礎設施的設計和部署的,我們正在建造、租用或升級數據中心基礎設施,以適應這種創新的、節省成本的和更為高效的技術。

  ML可以在一臺機器上運行,但由于難以置信的數據吞吐量通常會在多臺機器上運行。所有機器都互相連接,在訓練和數據處理階段,所有設備都相互連接,以確保持續的通信和低延遲,絕對不會中斷在我們指尖、屏幕或音頻設備上的服務。作為一個人類,我們對越來越多數據的渴望正在推動帶寬指數的增長,以滿足我們最簡單的想法。

  這種帶寬需要在設備內部和跨多個設備分布,使用更復雜的架構設計(spine-and-leaf)。我們說的super-spine和super-leaf它們為所有復雜的算法提供了一條高速公路,以便數據在不同的設備之間傳輸,最終回到我們的接收器。

  數據中心中的技術部署選項

  這就是光纖在將您的特殊(或搞怪)時刻的圖片或視頻播放給全世界觀看,分享和評論方面發揮關鍵作用的地方。與銅纜相比,光纖具有高速和超高密度的性能,已成為我們數據中心基礎設施中的實際傳輸介質。隨著我們向更高的網絡速度遷移,還在混合部署中引入了全新的復雜性,也就是將采用哪種技術?

  傳統的3層網絡架構使用核心、聚合和邊緣交換來連接數據中心內的不同服務器,服務器間的通信通過光收發器以南北向的方式彼此通信。然而現在,非常感謝AI和ML為游戲帶來的高計算要求和相互依賴性,更多的網絡使用2層的spine-and-leaf網絡,由于生產和培訓網絡所需的超低延遲,服務器之間以東西方向進行通信。

  自2010年IEEE批準40G和100G網絡傳輸技術標準以來,出現了許多相互競爭的解決方案,這些解決方案在一定程度上影響了用戶的判斷,因為他們不確定應該采用哪種方式。解釋一下,在40G之前,我們使用的是SR(即多模的短距離傳輸)和LR(即單模的長距離傳輸)。兩者都使用一對光纖在兩個設備之間傳輸信息。無論您使用哪種設備或在該設備中安裝了哪種收發器,這都是通過兩芯光纖進行的簡單數據交換。

  但是隨著IEEE批準了40G及更高速率的解決方案后,游戲規則發生了改變。現在我們正在研究使用標準批準的或專有的兩種方案,專有的WDM技術,和標準批準的、或多源協議(MSAs)認可的并行光學技術,并行光學技術使用8芯光纖(4芯發送和4芯接收)或20芯光纖(10芯發送和10芯接收)。

  如果您想使用標準認可的解決方案并降低光學器件成本,并且在不需要單模光纖的長距離能力的情況下,您可以選擇多模并行光學技術。它還可以讓您將高速40或100G的交換機端口拆分為更靈活的10或25G服務器端口。我將在本文中更詳細的介紹這一點。

  如果您希望延長已安裝的雙工光纖系統的使用壽命,并且不介意在沒有通用性選項的情況下繼續使用單一的硬件供應商,也不需要更長的傳輸距離,那么您可以選擇多模WDM解決方案。

  現在我要告訴你的是,大多數大規模部署人工智能的科技公司都在為今天和明天的網絡設計…單模并行光學系統。這里有三個簡單的原因。

  1.成本和距離

  目前的市場趨勢是并行光學解決方案首先開發和發布,幾年后WDM解決方案也隨之發布,因此使用并行光學解決方案的數量大大增加,從而降低了制造成本。 與2 km和10 km WDM解決方案相比,并行光學解決方案支持更短的距離,因此您不需要太多復雜的組件來冷卻激光器,并對兩端信號進行復用和解復用。雖然我們已經看到這些“超大型”設施的規模已經激增到3-4個足球場的大小,但我們的數據顯示,單模光纖的平均部署長度尚未超過165米,因此無需使用更昂貴的WDM收發器來滿足他們不需要支持的距離。

  2.靈活性

  部署并行光學設備的一個主要優勢是能夠使用高速交換機端口,比如40G,并將其分解為4x10G服務器端口。端口拆分提供了巨大的經濟性,因為拆分低速端口可以顯著的將電子設備的機箱或機架安裝單元數量減少到1/3(數據中心資產并不便宜),并且使用更少的電源,需要更少的冷卻,從而進一步降低能源消耗。我們的數據顯示這相當于在單模解決方案上節省30%。光纖收發器供應商還確認,在所有銷售的并行光收發器中,有很大一部分是為了利用這個端口拆分能力而部署的。

  3.簡單清晰的遷移

  主要交換機和收發器廠商的技術路線圖為部署并行光學的客戶提供了非常清晰和簡單的遷移路徑。我之前提到過,大多數科技公司都遵循這條路徑,所以當系統從100G遷移到200g或400G時,光纖基礎設施仍然保持不變,不需要任何升級。那些決定使用雙工,2芯光纖為布線基礎的公司可能會發現他們想要升級到100G以上,WDM光學技術可能無法在其遷移計劃的時間范圍內完成。

 對數據中心設計的影響

  從連接性的角度來看,這些網絡是高度網狀的光纖基礎設施,以確保沒有任何一臺服務器彼此之間的網絡跳數超過兩個。但是帶寬需求如此之大,以至于從spine交換機到leaf交換機的3:1的收斂比配置是不夠的,因此更常用的是從不同數據核心之間的超級spine進行分布式計算。

  由于交換機IO速度的顯著提高,網絡運營商正在努力提高利用率,我們通過使用從spine到leaf的1:1收斂比例設計系統,達到了更高的效率和超低的延遲,在當今的人工智能環境中,這是一個昂貴但必要的需求。

  此外,在谷歌最近宣布推出最新的人工智能硬件后,我們又一次改變了傳統的數據中心設計,這是一種定制的專用集成電路,稱為張量處理單元(TPU 3.0),在其巨大pod設計中,其功率將是過去的TPU的8倍,超過100 petaflops。但是,在芯片中加入更多的計算能力也會增加驅動它的能量,因此也會增加熱量,這也是為什么大量的聲明聲稱,由于TPU 3.0產生的熱量已經超過了以前的數據中心冷卻解決方案的限制,將轉向對芯片進行液體冷卻的原因。

  最后

  人工智能是下一波商業創新。它所帶來的優勢來自運營成本的節約、額外的收入流、簡化以及更高效的客戶交互,數據驅動的工作方式帶來的優勢太有吸引力了——不僅對CFO和股東如此,對客戶也是如此。這一點在最近的一次組內討論中得到了證實,專家當時表示使用聊天機器人的網站,如果效率不高且客戶關注度不夠,客戶就會放棄對話,并且很難再次合作。

  因此,我們必須接受這項技術并從中受益,這也意味著采用一種不同的方式來思考數據中心的設計和實施。由于ASIC的性能顯著提高,我們最終會看到IO速度的提高,從而進一步提高系統的聯通性。概括來講,您的數據中心在支持ML訓練的同時,需要超高效率,高密度,超低延遲,東西向的spine-and-leaf光纖網絡,以適應您的日常流量需求。

  我們已經看到,主要的科技公司是如何接受人工智能的,以及采用并行單模技術如何幫助它們比傳統的雙工模式獲得更好的資本和運營成本的,后者承諾從第一天起就降低成本。但是,數據中心的運營從第二天就開始了,隨著我們個人及行業內交流習慣和方式的不斷變化、速度的提高和復雜性的增加,數據中心的運營也在不斷發展。現在部署正確的布線基礎設施解決方案,將使您的企業從一開始就獲得更大的經濟效益,留住和吸引更多的客戶,并使您的數據中心設施能夠更靈活的蓬勃發展。

內容來自:訊石光通訊咨詢網
本文地址:http://www.gmsoo.tw//Site/CN/News/2019/03/12/20190312083217443119.htm 轉載請保留文章出處
關鍵字: 人工智能
文章標題:康寧:人工智能及其對數據中心的影響
【加入收藏夾】  【推薦給好友】 
免責聲明:凡本網注明“訊石光通訊咨詢網”的所有作品,版權均屬于光通訊咨詢網,未經本網授權不得轉載、摘編或利用其它方式使用上述作品。 已經本網授權使用作品的,應在授權范圍內使用,反上述聲明者,本網將追究其相關法律責任。
※我們誠邀媒體同行合作! 聯系方式:訊石光通訊咨詢網新聞中心 電話:0755-82960080-168   Right
彩神网推荐《火爆四肖中特》 快乐赛车人工全天计划 网上合买平台 腾讯麻将游戏 技术和学历哪个赚钱多 新疆18选7的开奖结果查询 mg电子游戏网站在哪里 福彩35选7开奖公告 14场胜负彩最新预测公告彩票 nba比分网 163皇冠即时比分