作者:陳翔
云計算——這一代表未來(lái)計算發(fā)展方向的技術(shù),居然是由電子商務(wù)企業(yè)亞馬遜首先推出的。為何亞馬遜會(huì )比專(zhuān)業(yè)的IT企業(yè)還要超前?這家企業(yè)在云計算方面又出了什么新招?亞馬遜云計算部門(mén)負責人JeffBarr近日透露了亞馬遜的秘訣。
超前于其他專(zhuān)業(yè)IT企業(yè),最早以賣(mài)書(shū)著(zhù)稱(chēng)的電子商務(wù)網(wǎng)站——亞馬遜居然是最早提出云計算概念的廠(chǎng)商,也是最早提供成熟云計算服務(wù)的供應商。對于為何亞馬遜會(huì )比專(zhuān)業(yè)的IT企業(yè)在云計算方面還要超前的問(wèn)題,亞馬遜云計算部門(mén)負責人JeffBarr(杰夫)認為,這非常容易理解。
亞馬遜的生意經(jīng)
作為一家超大型零售企業(yè),亞馬遜在設計和規劃自身電子商務(wù)系統IT架構的時(shí)候,不得不為了應對銷(xiāo)售峰值去購買(mǎi)更多的IT設備。但是,這些設備平時(shí)卻處于空閑狀態(tài),這在零售企業(yè)看來(lái)相當不劃算。于是亞馬遜發(fā)現,假如可以運用自身在網(wǎng)站優(yōu)化上的技術(shù)和經(jīng)驗優(yōu)勢,亞馬遜就可以將這些設備、技術(shù)和經(jīng)驗作為一種打包產(chǎn)品去為其他企業(yè)提供服務(wù),那么閑置的IT設備就會(huì )創(chuàng )造價(jià)值。這就是亞馬遜推出云計算服務(wù)的初衷。
為了解決這些租用服務(wù)中的可靠性、靈活性、安全性等問(wèn)題,亞馬遜不斷優(yōu)化其技術(shù)。從2004年開(kāi)始,亞馬遜陸續推出了簡(jiǎn)單隊列服務(wù)、MechanicalTurk等云計算服務(wù)雛形。JeffBarr表示,云計算服務(wù)成熟的標志是亞馬遜在2006年推出的簡(jiǎn)單存儲服務(wù)(S3)和彈性計算云(EC2)。之后,企業(yè)數據和服務(wù)都已被放在亞馬遜的“云端”了。那么“云端”到底在哪里呢?其實(shí)就是亞馬遜分布在全球的服務(wù)器——這些服務(wù)器可以在瞬間共同完成租用企業(yè)的一個(gè)任務(wù)。
紛繁復雜的云計算
亞馬遜在云計算方面走在其他IT專(zhuān)業(yè)企業(yè)之前既是偶然,也是必然??此朴行盁o(wú)心插柳”,但任何技術(shù)都源于需求——亞馬遜自身就是云計算的最早用戶(hù)。如今,云計算的概念已經(jīng)在業(yè)界成為熱門(mén)話(huà)題,云存儲、云安全等名詞也開(kāi)始出現,IBM、微軟、Google等不同領(lǐng)域的企業(yè)都已經(jīng)紛紛投入到這一新型計算技術(shù)的大潮之中。那么亞馬遜的優(yōu)勢還存在嗎?
JeffBarr認為,這里涉及一個(gè)核心概念——云計算是分層分類(lèi)的,每一類(lèi)公司提供的云計算的服務(wù)都不一樣,而亞馬遜是IT基礎架構云計算服務(wù)提供商。在網(wǎng)絡(luò )互聯(lián)的需求之上,直接就是亞馬遜的最底層的IT基礎架構AWS(AmazonWebServices),這包括計算、存儲、內容分發(fā)等等。在這層IT基礎架構之上,用戶(hù)才可以構建自己的應用層。應用層又包括構建數據庫、應用服務(wù)器,最上一層才是應用軟件。他表示,目前看來(lái),市場(chǎng)上很多云計算服務(wù)提供商所提供的服務(wù),僅僅是不同層面的一部分解決方案。
此外,亞馬遜的角色非常特殊——它不是操作系統開(kāi)發(fā)商,也不是服務(wù)器或存儲設備制造商,也就是說(shuō)它是應用者而非IT系統制定者。因此亞馬遜的平臺是開(kāi)放的。但是專(zhuān)業(yè)IT企業(yè)提供的云計算多多少少會(huì )限制在自己提供的系統之上,限制了靈活性。此外,正因為亞馬遜自己是應用者,因此它賣(mài)給企業(yè)用戶(hù)的不僅是云計算技術(shù),還有自身的經(jīng)驗教訓,這些都能夠幫助企業(yè)用戶(hù)更好地應用云計算服務(wù)去創(chuàng )造更大的價(jià)值。
云計算如賣(mài)書(shū)
正是因為這些獨特的優(yōu)勢,亞馬遜云計算服務(wù)增長(cháng)顯著(zhù)。雖然JeffBarr沒(méi)有透露投入和收入,但是目前亞馬遜云計算的注冊開(kāi)發(fā)人員數量在去年已經(jīng)超過(guò)49萬(wàn)。它目前推出的最主要的云計算服務(wù)產(chǎn)品,不僅服務(wù)分類(lèi)靈活、收費方式多樣,而且定價(jià)方式還體現了零售企業(yè)一貫的做法。
據悉,彈性云EC2服務(wù)能夠同時(shí)調用亞馬遜全球的從一個(gè)到幾千個(gè)服務(wù)器,這些服務(wù)還可細分為CPU處理系統、隨機存儲容量、硬盤(pán)空間等,根據用戶(hù)的需求或者規格可以支持所有的操作系統,并安裝各種各樣的開(kāi)放源代碼或商業(yè)軟件。用戶(hù)甚至可以直觀(guān)地看到支持某種操作時(shí)調用的全球服務(wù)器的物理地址。而EC2的報價(jià)也因此呈現多樣化,租用費用從每小時(shí)0.1美元到0.8美元不等。
簡(jiǎn)單存儲服務(wù)S3可以提供一個(gè)字節到數GB字節的支持,整個(gè)系統里大概有520億對象進(jìn)行數據交換。S3的存儲備份服務(wù)則是按照每個(gè)月的使用字節來(lái)收費,根據每天檢測流量,每GB大約0.15美元/月。亞馬遜最近還推出了內容分發(fā)網(wǎng)絡(luò )服務(wù)(CloudFront),可以把一個(gè)內容迅速地復制到全球至少40個(gè)服務(wù)器上,以便快速地登錄和獲取。為了體現地域的特色,亞馬遜針對歐洲用戶(hù)的售價(jià)會(huì )比美國高出10%左右。
更有意思的是,亞馬遜還嘗試了云計算的價(jià)格促銷(xiāo)。JeffBarr表示,亞馬遜云計算價(jià)格體系的設置是自下而上的,也就是說(shuō)亞馬遜并不是通過(guò)關(guān)注市場(chǎng)上的競爭產(chǎn)品或用戶(hù)承受程度來(lái)確定產(chǎn)品價(jià)格,而是根據自身的成本核算加上合理的利潤空間后將價(jià)格盡量定到最低,因此定價(jià)也富有競爭力?!斑@也源于亞馬遜的經(jīng)營(yíng)理念。作為零售企業(yè),亞馬遜有一個(gè)天天低價(jià)的承諾,我們每天想的是怎么樣能夠把價(jià)格降下來(lái)。在云計算方面,我們也采用這種價(jià)格體系策略?!?/p>
此外,目前云計算的服務(wù)對象多是中小企業(yè),亞馬遜也在嘗試將其應用到政府、科研等研究領(lǐng)域和大型企業(yè)的關(guān)鍵應用當中——亞馬遜推出了針對大型數據庫的簡(jiǎn)單數據庫服務(wù),該服務(wù)在安全性、登錄管理、賬戶(hù)管理方面都有獨特的設置方式。尤其在賬戶(hù)管理方面,不僅有整體的賬戶(hù),還會(huì )有分賬戶(hù)的復雜管理。該服務(wù)將按照字節單獨計費。值得一提的是,美國某些地方的個(gè)稅系統已經(jīng)開(kāi)始應用云計算架構,也許讓云架構涉及核心應用已經(jīng)為時(shí)不遠。
CTO博客:解讀Doeswijk數據模型
日立數據存儲公司CTOHuYoshida
作為我工作的一部分,我努力想找到一種將益處和挑戰充分聯(lián)系起來(lái)的技術(shù)和商業(yè)模式,并不斷嘗試用新的方法來(lái)尋找其中更有效的一種。
此前我訪(fǎng)問(wèn)一個(gè)客戶(hù),他們的存儲架構師介紹了他們業(yè)務(wù)數據、存儲的增長(cháng)與Doeswijk數據模型。他說(shuō),現在有三個(gè)方面的數據增長(cháng),必須同時(shí)得到關(guān)注。首先,主要造成數據增長(cháng)應用的人員在竭盡所能地創(chuàng )造數據;其次,存儲管理員還需要為快速增長(cháng)的文件副本等重復數據擔心;第三,需要保留的數據所構成的靜態(tài)數據存檔。主要數據需要對許多應用提供副本,如備份、開(kāi)發(fā)測試、數據挖掘等。在一段時(shí)間內,大多數主要數據開(kāi)始變得陳舊和無(wú)用,但依然需要保留存檔備份,至少需要保留一個(gè)副本以供數據恢復使用。在不同的情況下,數據可以放在不同的成本和性能等級的存儲介質(zhì)中。
思考數據的這些狀況很重要,因為它有助于我們理解為什么我們總是缺少足夠的存儲空間。許多應用程序用戶(hù)只是在計劃生產(chǎn)階段的數據,對保存、分析和共享他們的數據會(huì )帶來(lái)多少份數據副本毫無(wú)概念。他們大多不關(guān)心數據生產(chǎn)過(guò)程結束后會(huì )發(fā)生什么,因為他們將迎來(lái)一個(gè)新的應用,而其他人才會(huì )為保留或刪除這些數據而操心。在這些數據上進(jìn)行修改將會(huì )帶來(lái)一個(gè)乘數效應的總數據量。例如:如果表示數據總量的立方體尺寸是2×2×2,其體積將是8;如果我們將一個(gè)邊的長(cháng)度改成3,則3×2×2得出的數據總量是12。
數據保留在存儲空間內,存儲空間的容量可以看作一個(gè)能容納固定數量數據的立方體。這個(gè)立方體的體積所能提供的存儲容量與各個(gè)方面的數據量相關(guān)。在某些情況下,它還和分層存儲的方式以及其中涉及到相應的數據層面有關(guān)。通常的存儲容量體積大于數據量,但隨著(zhù)新技術(shù)如重復數據刪除、壓縮等的發(fā)展,存儲容量可能小于數據量。
通過(guò)這一模型,我們可以看出,一般情況下,存儲容量只是剛剛滿(mǎn)足數據量的要求。然而,數據量在三個(gè)方向上都可能發(fā)生改變從而帶來(lái)乘數效應的增長(cháng),這就會(huì )使數據量立方體的體積超出原有的存儲容量立方體,造成存儲容量的不足。
MaartinDoeswijk是一位年輕的荷蘭存儲架構師,他首先提出了這一模式。我建議將該模型命名為Doeswijk數據模型。同時(shí),我將把該模型應用在我的工作中。
相關(guān)閱讀