logo

行業(yè)新聞

解密騰訊云計算進化背后的那些事!

點擊數(shù):3843來源:申耀的科技觀察發(fā)布時間:2017-09-30


像人類歷史上其他重大技術(shù)革命一樣,云的影響遠遠超過技術(shù)本身,還影響了商業(yè)模式和人的思維模式,引發(fā)了一系列商業(yè)創(chuàng)新的革命。隨著云快速發(fā)展和迭代,未來企業(yè)是云化的主角,各行各業(yè)將在云中成長,也將在智能化浪潮中迎來蛻變。

今年6月,騰訊集團董事局主席兼CEO馬化騰指出:“云是產(chǎn)業(yè)革新的源動力,是新型社會管理的主平臺,是人工智能的強載體?!彼珜б浴坝迷屏俊眮砗饬课磥淼慕?jīng)濟指數(shù)。

那么,在這個過程中,騰訊云如何將“用云量”實現(xiàn)落地?如何讓智能化驅(qū)動數(shù)字經(jīng)濟的增長呢?日前,在騰訊舉辦的Tech Camp深度交流沙龍上,筆者和兩位騰訊云專家工程師就云服務器、以及數(shù)據(jù)中心建設(shè)等工作做了深入溝通,首次對外披露了騰訊云作為智能化時代的“修路者”,在基礎(chǔ)設(shè)施技術(shù)研發(fā)領(lǐng)域,那些不為人知的秘密。

揭秘第三代云服務器

眾所周知,隨著全面云化時代的到來,對包括騰訊云在內(nèi)的諸多中國云服務商提出了更高的要求和挑戰(zhàn),比如云服務器,作為云計算最基礎(chǔ)的服務模塊,就必須滿足他們對高性能、高可靠性以及一些極致的計算需求。

騰訊云計算產(chǎn)品中心總監(jiān)沙開波

在騰訊云計算產(chǎn)品中心總監(jiān)、專家工程師沙開波看來:“客戶需求始終是我們最大的驅(qū)動力,為此,騰訊云通過三次迭代和升級,全面打造了面向不同企業(yè)規(guī)模、不同應用場景的計算實例?!?/span>

據(jù)了解,騰訊云目前對外提供的云服務器(CVM)矩陣包含了26款實例,全面覆蓋電商、視頻、游戲、金融、基因測序、智能語音、汽車、醫(yī)療、物聯(lián)網(wǎng)等192種業(yè)務場景。

其中,今年9月25日最新發(fā)布的第三代云服務器(CVM)矩陣,更全面基于英特爾Xeon Skylake至強處理器、支持25GE雙bonding網(wǎng)絡(luò)環(huán)境,并采用了諸如分布式塊存儲技術(shù)4.0、網(wǎng)絡(luò)虛擬化技術(shù)2.0和KVM虛擬化技術(shù)3.0等一系列業(yè)界領(lǐng)先的技術(shù),使得騰訊云一系列計算實例的競爭力得以大大提升,具體來看:

第一,針對通用業(yè)務場景,騰訊云基于Intel新一代的Skylake CPU推出標準型SN3、計算型CN3和內(nèi)存型MN3三款新實例,其計算性能整體提升60%,并提供最高25Gbps的內(nèi)網(wǎng)帶寬,網(wǎng)絡(luò)收發(fā)包性能相比上一代提升2倍,內(nèi)網(wǎng)帶寬提升2.5倍;同時,基于AMD EPYC系列CPU的標準型SA1實例,提供最高128核規(guī)格的實例配置,可有效滿足客戶對超大CPU核數(shù)的計算需求。

第二,針對存儲業(yè)務場景,騰訊云推出大數(shù)據(jù)機型DN3實例,采用吞吐型HDD本地盤,順序讀寫帶寬最高可達2.3GB/s,相比普通本地盤提升4.7倍,適合對磁盤吞吐要求高的大數(shù)據(jù)業(yè)務。
此外,IO密集型I3實例,則采用本地NVMe SSD硬盤,隨機IOPS最高可達100w IOPS,相比SSD本地盤,隨機讀寫IOPS提升13.3倍,適合給對IOPS性能要求高的業(yè)務使用。
第三,針對網(wǎng)絡(luò)優(yōu)化場景,騰訊云推出新型網(wǎng)絡(luò)優(yōu)化型實例N1,該實例采用新型智能網(wǎng)卡,通過硬件實現(xiàn)加速包轉(zhuǎn)發(fā),使網(wǎng)絡(luò)轉(zhuǎn)發(fā)性能從原有的40w提高到450w以及高達25Gbps的網(wǎng)絡(luò)帶寬,網(wǎng)絡(luò)延時降低至接近物理網(wǎng)卡水平。同時,其內(nèi)網(wǎng)帶寬提升2.5倍,網(wǎng)絡(luò)收發(fā)包性能提升更高達9倍。
第四,在云盤產(chǎn)品上,騰訊云基于第四代塊存儲技術(shù),帶來了云盤產(chǎn)品性能的大服務提升。其中,超高性能SSD云盤,IOPS相比較現(xiàn)在的SSD云盤,IOPS從2.4w 提升到20w,性能提升8.3 倍;而吞吐優(yōu)化HDD云盤,相比較現(xiàn)在的普通云盤,其最大吞吐從100MB/s提升到500MB/s,提升5倍。

對此,沙開波表示,在硬件升級的同時,騰訊云在軟件方面也做了全新的迭代。舉例來說,針對外界高度關(guān)注的熱遷移功能,騰訊云通過KVM虛擬化技術(shù)3.0,將兼容更多的硬件,并進一步優(yōu)化了熱遷移技術(shù),通過熱遷移技術(shù),可以在客戶無感知的情況下完全規(guī)避掉硬件隱患,提升CVM可用性。

再如,智能網(wǎng)卡的引入,騰訊云通過網(wǎng)絡(luò)虛擬化技術(shù)2.0技術(shù),推出了國內(nèi)首款基于智能網(wǎng)卡的云服務器實例N1,該實例完美解決了傳統(tǒng)虛擬化網(wǎng)絡(luò)繞行到母機網(wǎng)卡的問題,使得網(wǎng)絡(luò)收發(fā)包性能提升9倍,性能高達450萬。

“有了智能網(wǎng)卡之后,我們可以把網(wǎng)絡(luò)虛擬化的工作放到硬件層面去做。這也是硬件的升級、技術(shù)的變化帶來性能指標全方位提升的體現(xiàn)?!鄙抽_波說。

總的來看,從通用型到各個面向應用場景的優(yōu)化型實例,騰訊云第三代云服務器將通過一系列軟硬件升級,讓整個云服務器矩陣的功能和場景更加全面和完善。

這樣的好處是顯而易見的,無論是初創(chuàng)企業(yè),還是大中型企業(yè),不管是做計算、存儲還是網(wǎng)絡(luò),不通規(guī)模的企業(yè)都能輕易的找到適合自身業(yè)務的實例,無疑也有助于騰訊云能夠更廣泛的覆蓋用戶的不同需求。

全面賦能產(chǎn)業(yè)智能化

我們知道,人工智能的三大要素是算法、數(shù)據(jù)和計算。特別是隨著人工智能深度神經(jīng)網(wǎng)絡(luò)的快速發(fā)展,更深更大的算法模型、更復雜的架構(gòu)正在成為趨勢。

所以,目前業(yè)界已經(jīng)形成了這樣的共識,那就是人工智能對計算能力的需求是“永無止境”的,這就需要提供比傳統(tǒng)計算架構(gòu)更加強大的計算能力和每瓦特性能。

在此背景之下,GPU、FPGA等異構(gòu)計算在過去幾年之內(nèi)迅速崛起,相比單純的CPU計算架構(gòu),異構(gòu)計算更能滿足人工智能、深度學習對強大計算性能、計算能效以及計算實時性的需求,它的出現(xiàn)對推動和加速整個人工智能的落地無疑有著巨大的作用。

實際上,騰訊云同樣高度重視在異構(gòu)計算領(lǐng)域的布局。在最新的第三代云服務器(CVM)矩陣中,騰訊云推出了一款基于新型GPU計算的實例,以及兩款基于FPGA計算的實例。
其中,GN9實例搭載最新一代NVIDIA V100 GPU卡,單機最高支持8卡,在GPU計算性能上相比較第一代GN2實例將會有一個極大的提升,單精度浮點運算性能將提升8倍,雙精度浮點運算性能將提升140倍。
不僅如此,針對FPGA,騰訊云推出了基于賽靈思VU9P FPGA卡的FX3實例,單機最高支持8卡,峰值計算性能相比前一代FX2實例提升3倍;而基于英特爾Stratix10 FPGA卡的FI3實例,單機最高支持8卡,單精度浮點運算性能達80TFLOPS。
值得一提的是,相對GPU,F(xiàn)PGA開發(fā)有著更高的門檻。因此,為簡化用戶使用FPGA、分發(fā)FPGA、部署FPGA、運維FPGA的業(yè)務流程,騰訊云還推出了FPGA IP市場,該市場通過解決FPGA云服務器的部署、IP提供者分享IP以及開發(fā)者購買IP等核心問題,以進一步推動FPGA開發(fā)者生態(tài)的構(gòu)建與完善。
在沙開波看來:“整個計算技術(shù)的發(fā)展其實是離不開業(yè)務場景的一個驅(qū)動,業(yè)務場景反過來會驅(qū)動計算技術(shù)不斷往前變革。騰訊云憑借扎實的技術(shù)實力,能夠針對不同的業(yè)務場景提供一些定制化的服務,通過穩(wěn)定、可靠、高性能的彈性計算服務加速信息應用的落地,通過計算全面賦能企業(yè),通過計算驅(qū)動企業(yè)的智能創(chuàng)新?!?/span>
例如,騰訊云為摩拜單車提供了一整套云端與車載通信服務,包括數(shù)據(jù)庫托管、物聯(lián)網(wǎng)接入、網(wǎng)絡(luò)安全、云監(jiān)控及云測試,使摩拜單車的性能、穩(wěn)定性、安全性迅速提升,更有效支撐了摩拜單車每天超過2500萬訂單的創(chuàng)建。

此外,騰訊云還幫助順豐快遞完成了2000萬手寫快遞單的識別。在此之前,如此海量的手寫快遞單識別,需要一天的時間,但現(xiàn)在借助騰訊云的高性能計算和人工智能技術(shù),只需要3個小時即可完成該項工作,極大提升了順豐快遞的企業(yè)生產(chǎn)力。

由此可見,在人工智能成為新風口之際,已經(jīng)走在技術(shù)應用前沿的騰訊云更是要讓各行各業(yè),都能感受到人工智能帶來的價值,用人工智能為中國的產(chǎn)業(yè)升級發(fā)展賦予新的力量。

騰訊云的決心和信心

實際上,除了基礎(chǔ)設(shè)施升級之外,騰訊云近期還在數(shù)據(jù)中心網(wǎng)絡(luò)建設(shè)、運維保障、海外布局方面也有了突飛猛進的發(fā)展,這不僅是對騰訊云“云+”戰(zhàn)略的深化,對行業(yè)則是邁出了推動企業(yè)上云和技術(shù)標準升級的重要一步。

騰訊云運營保障中心高級總監(jiān)徐勇州
據(jù)騰訊云運營保障中心高級總監(jiān)、專家工程師徐勇州介紹,可以用“廣、穩(wěn)、融、快、全、精”六字訣形容騰訊云數(shù)據(jù)中心目前的建設(shè)狀態(tài),其未來目標即推動“數(shù)據(jù)中心即服務”的落地。
首先,在海外數(shù)據(jù)中心布局方面,目前騰訊云已經(jīng)在全球21個地理區(qū)域,運營36個可用區(qū)(其中國內(nèi)19個,海外17個),為全球用戶提供包括計算、網(wǎng)絡(luò)、存儲等多項產(chǎn)品能力。
根據(jù)規(guī)劃,2017年底2018年初,騰訊云還計劃再開放7個數(shù)據(jù)中心,包括印度孟買、日本東京、俄羅斯莫斯科、泰國曼谷等節(jié)點,以及美國東部的華盛頓節(jié)點。此外,騰訊云還計劃開放香港、美國硅谷等地的第二個可用區(qū),由此形成一個覆蓋全球的數(shù)據(jù)中心節(jié)點。
其次,在數(shù)據(jù)中心及基礎(chǔ)設(shè)施安全與可靠性方面,騰訊云一直秉承業(yè)界最高的建設(shè)標準。例如,在等級方面,嚴格采用Tier3+等級,且可用區(qū)域獨立自然災害隔離區(qū)域;在供電系統(tǒng)方面,采用全雙路高冗余的多種實現(xiàn)模式,且采用才柴油發(fā)電機N+1的冗余,滿載可支持24-72個小時的超長備用供電;此外,數(shù)據(jù)中心大樓及園區(qū)內(nèi)外提供全獨立的物理進線及路由等。
再次,在骨干網(wǎng)覆蓋、帶寬及異地調(diào)度能力方面,騰訊云在全球共建設(shè)了10+Tb級的骨干網(wǎng)絡(luò),并采取了海纜+陸纜多重冗余設(shè)計;除了IDC核心節(jié)點之外,騰訊還在POP和CDN方面都進行了全球化的布局,現(xiàn)已經(jīng)建設(shè)了30+POP邊緣節(jié)點;CDN則覆蓋全球800+節(jié)點,擁有近70TB帶寬儲備。
最后,在運維保障體系方面,騰訊云為每個機房均配備精銳的現(xiàn)場運維團隊,在海外數(shù)據(jù)中心還配備了根據(jù)所在區(qū)域業(yè)務需要配備“雙語”運維團隊,所有人員均通過了騰訊IT運維工程師認證體系的認證,能夠全天候,不分時區(qū)、地區(qū)和國家地提供駐場服務,現(xiàn)場直接協(xié)助客戶解決遇到的問題。
總的來說,為了讓“用云量”落地,一方面騰訊云通過為不同類型的企業(yè)級用戶服務,總結(jié)出了針對多樣化場景的解決方案;另一方面,則是騰訊云積極優(yōu)化數(shù)據(jù)中心,基礎(chǔ)設(shè)施的技術(shù)以及運維服務等能力,不斷推動云成為智能化時代的驅(qū)動力。
在我看來,騰訊云正以前所未有的前瞻力和爆發(fā)力,加速全面云化時代的到來,這是云計算市場進化的必然趨勢,也是騰訊云不斷創(chuàng)新和突破的印證。而在這背后,更是騰訊云賦能產(chǎn)業(yè)智能化的決心和信心的體現(xiàn)。

可以預期,未來越來越多的企業(yè)將踏上云化和智能化轉(zhuǎn)型之路,現(xiàn)在騰訊云通過開放和賦能,將讓業(yè)界更多的公司享受到云計算和人工智能帶來的價值,成為他們邁入智能化領(lǐng)域的“引路人”,這也是智能化新時代,騰訊云所需要扮演的新角色以及必須肩負的新責任。

申耀的科技觀察,由非著名科技媒體人申耀創(chuàng)辦、10萬公里公路自駕經(jīng)驗老斯基,在各大自媒體平臺擁有專欄,致力于科技行業(yè)的觀察和思考,在這里讀懂科技行業(yè),知趨勢,贏未來!

首頁 |方案|支持|案例|關(guān)于