国产免费观看青青草原网站_久久精品视频色悠悠_影音先锋激情5566_日本一區二區三區免費高清在線_麻豆精品一区综合av_丰满的大屁股一区二区_男女啪啪免费网站_草莓视频app在线观看下载_午夜寂寞少妇AA片_混乱的生物课月老师后续视频

 
您現(xiàn)在的位置:首頁 ? 知識庫 ? 軟件開發(fā) 軟件開發(fā)
分布式ID生成器 | 架構(gòu)師之路
發(fā)布日期:2017-09-05

一、需求緣起

幾乎所有的業(yè)務(wù)系統(tǒng),都有生成一個唯一記錄標識的需求,例如:

  • 消息標識:message-id

  • 訂單標識:order-id

  • 帖子標識:tiezi-id


這個記錄標識往往就是數(shù)據(jù)庫中的主鍵,數(shù)據(jù)庫上會建立聚集索引cluster index),即在物理存儲上以這個字段排序。

 

這個記錄標識上的查詢,往往又有分頁或者排序的業(yè)務(wù)需求,例如:

  • 拉取最新的一頁消息

     select message-id/ order by time/ limit 100

  • 拉取最新的一頁訂單

     select order-id/ order by time/ limit 100

  • 拉取最新的一頁帖子

     select tiezi-id/ order by time/ limit 100


所以往往要有一個time字段,并且在time字段上建立普通索引non-cluster index)。

 

普通索引存儲的是實際記錄的指針,其訪問效率會比聚集索引慢,如果記錄標識在生成時能夠基本按照時間有序,則可以省去這個time字段的索引查詢:

select message-id/ (order by message-id)/limit 100


強調(diào),能這么做的前提是,message-id的生成基本是趨勢時間遞增的

 

這就引出了記錄標識生成(也就是上文提到的三個XXX-id)的兩大核心需求:

  • 全局唯一

  • 趨勢有序

這也是本文要討論的核心問題:如何高效生成趨勢有序的全局唯一ID。

 

二、常見方法、不足與優(yōu)化

方法一:使用數(shù)據(jù)庫的 auto_increment 來生成全局唯一遞增ID


優(yōu)點:

  • 簡單,使用數(shù)據(jù)庫已有的功能

  • 能夠保證唯一性

  • 能夠保證遞增性

  • 步長固定


缺點:

  • 可用性難以保證:數(shù)據(jù)庫常見架構(gòu)是一主多從+讀寫分離,生成自增ID是寫請求,主庫掛了就玩不轉(zhuǎn)了

  • 擴展性差,性能有上限:因為寫入是單點,數(shù)據(jù)庫主庫的寫性能決定ID的生成性能上限,并且難以擴展


改進方法:

  • 冗余主庫,避免寫入單點

  • 數(shù)據(jù)水平切分,保證各主庫生成的ID不重復(fù)


如上圖所述,由1個寫庫變成3個寫庫,每個寫庫設(shè)置不同的auto_increment初始值,以及相同的增長步長,以保證每個數(shù)據(jù)庫生成的ID是不同的(上圖中庫0生成0,3,6,9…,庫1生成1,4,7,10,庫2生成2,5,8,11…


改進后的架構(gòu)保證了可用性,但缺點是:

  • 喪失了ID生成的“絕對遞增性”:先訪問庫0生成0,3,再訪問庫1生成1,可能導(dǎo)致在非常短的時間內(nèi),ID生成不是絕對遞增的(這個問題不大,目標是趨勢遞增,不是絕對遞增)

  • 數(shù)據(jù)庫的寫壓力依然很大,每次生成ID都要訪問數(shù)據(jù)庫


為了解決上述兩個問題,引出了第二個常見的方案。

 

方法二:單點批量ID生成服務(wù)


分布式系統(tǒng)之所以難,很重要的原因之一是“沒有一個全局時鐘,難以保證絕對的時序”,要想保證絕對的時序,還是只能使用單點服務(wù),用本地時鐘保證“絕對時序”。


數(shù)據(jù)庫寫壓力大,是因為每次生成ID都訪問了數(shù)據(jù)庫,可以使用批量的方式降低數(shù)據(jù)庫寫壓力。



如上圖所述,數(shù)據(jù)庫使用雙master保證可用性,數(shù)據(jù)庫中只存儲當前ID的最大值,例如0。


 ID生成服務(wù)假設(shè)每次批量拉取6ID,服務(wù)訪問數(shù)據(jù)庫,將當前ID的最大值修改為5,這樣應(yīng)用訪問ID生成服務(wù)索要ID,ID生成服務(wù)不需要每次訪問數(shù)據(jù)庫,就能依次派發(fā)0,1,2,3,4,5這些ID了。


ID發(fā)完后,再將ID的最大值修改為11,就能再次派發(fā)6,7,8,9,10,11這些ID了,于是數(shù)據(jù)庫的壓力就降低到原來的1/6。


優(yōu)點

  • 保證了ID生成的絕對遞增有序

  • 大大的降低了數(shù)據(jù)庫的壓力,ID生成可以做到每秒生成幾萬幾十萬個


缺點

  • 服務(wù)仍然是單點

  • 如果服務(wù)掛了,服務(wù)重啟起來之后,繼續(xù)生成ID可能會不連續(xù),中間出現(xiàn)空洞(服務(wù)內(nèi)存是保存著0,1,2,3,4,5,數(shù)據(jù)庫中max-id5,分配到3時,服務(wù)重啟了,下次會從6開始分配,45就成了空洞,不過這個問題也不大)

  • 雖然每秒可以生成幾萬幾十萬個ID,但畢竟還是有性能上限,無法進行水平擴展


改進方法

單點服務(wù)的常用高可用優(yōu)化方案是“備用服務(wù)”,也叫“影子服務(wù)”,所以我們能用以下方法優(yōu)化上述缺點(1):


如上圖,對外提供的服務(wù)是主服務(wù),有一個影子服務(wù)時刻處于備用狀態(tài),當主服務(wù)掛了的時候影子服務(wù)頂上。


這個切換的過程對調(diào)用方是透明的,可以自動完成,常用的技術(shù)是vip+keepalived,具體就不在這里展開。


另外,ID-gen-service也可以實施水平擴展,以解決上述缺點(3),但會引發(fā)一致性問題,具體解決方案詳見《淺談CAS在分布式ID生成方案上的應(yīng)用》。

 

方法三:uuid/guid


不管是通過數(shù)據(jù)庫,還是通過服務(wù)來生成ID,業(yè)務(wù)方Application都需要進行一次遠程調(diào)用,比較耗時。


有沒有一種本地生成ID的方法,即高性能,又時延低呢?


uuid是一種常見的方案:

 string ID =GenUUID();


優(yōu)點

  • 本地生成ID,不需要進行遠程調(diào)用,時延低

  • 擴展性好,基本可以認為沒有性能上限


缺點

  • 無法保證趨勢遞增

  • uuid過長,往往用字符串表示,作為主鍵建立索引查詢效率低,常見優(yōu)化方案為轉(zhuǎn)化為兩個uint64整數(shù)存儲或者折半存儲(折半后不能保證唯一性)

 

方法四:取當前毫秒數(shù)


uuid是一個本地算法,生成性能高,但無法保證趨勢遞增,且作為字符串ID檢索效率低,有沒有一種能保證遞增的本地算法呢?


取當前毫秒數(shù)是一種常見方案:

 uint64 ID = GenTimeMS();


優(yōu)點

  • 本地生成ID,不需要進行遠程調(diào)用,時延低

  • 生成的ID趨勢遞增

  • 生成的ID是整數(shù),建立索引后查詢效率高


缺點

  • 如果并發(fā)量超過1000,會生成重復(fù)的ID


這個缺點要了命了,不能保證ID的唯一性。當然,使用微秒可以降低沖突概率,但每秒最多只能生成1000000ID,再多的話就一定會沖突了,所以使用微秒并不從根本上解決問題。

 

方法五:類snowflake算法


snowflaketwitter開源的分布式ID生成算法,其核心思想為,一個long型的ID: 

  •  41bit作為毫秒數(shù)

  •  10bit作為機器編號

  •  12bit作為毫秒內(nèi)序列號


算法單機每秒內(nèi)理論上最多可以生成1000*(2^12),也就是400WID,完全能滿足業(yè)務(wù)的需求。


借鑒snowflake的思想,結(jié)合各公司的業(yè)務(wù)邏輯和并發(fā)量,可以實現(xiàn)自己的分布式ID生成算法


舉例,假設(shè)某公司ID生成器服務(wù)的需求如下:

  • 單機高峰并發(fā)量小于1W,預(yù)計未來5年單機高峰并發(fā)量小于10W

  • 2個機房,預(yù)計未來5年機房數(shù)量小于4

  • 每個機房機器數(shù)小于100

  • 目前有5個業(yè)務(wù)線有ID生成需求,預(yù)計未來業(yè)務(wù)線數(shù)量小于10


分析過程如下:

  • 高位取從201711日到現(xiàn)在的毫秒數(shù)(假設(shè)系統(tǒng)ID生成器服務(wù)在這個時間之后上線),假設(shè)系統(tǒng)至少運行10年,那至少需要10*365*24小時*3600*1000毫秒=320*10^9,差不多預(yù)留39bit給毫秒數(shù)

  • 每秒的單機高峰并發(fā)量小于10W,即平均每毫秒的單機高峰并發(fā)量小于100,差不多預(yù)留7bit給每毫秒內(nèi)序列號

  • 5年內(nèi)機房數(shù)小于4個,預(yù)留2bit給機房標識

  • 每個機房小于100臺機器,預(yù)留7bit給每個機房內(nèi)的服務(wù)器標識

  • 業(yè)務(wù)線小于10個,預(yù)留4bit給業(yè)務(wù)線標識


 


這樣設(shè)計的64bit標識,可以保證:

  • 每個業(yè)務(wù)線、每個機房、每個機器生成的ID都是不同的

  • 同一個機器,每個毫秒內(nèi)生成的ID都是不同的

  • 同一個機器,同一個毫秒內(nèi),以序列號區(qū)區(qū)分保證生成的ID是不同的

  • 將毫秒數(shù)放在最高位,保證生成的ID是趨勢遞增的


缺點

  • 由于“沒有一個全局時鐘”,每臺服務(wù)器分配的ID是絕對遞增的,但從全局看,生成的ID只是趨勢遞增的(有些服務(wù)器的時間早,有些服務(wù)器的時間晚)

  • 1.公司登記注冊于2003年1月27日,清遠市桑達電子網(wǎng)絡(luò)媒體有限公司
    2.公司2006年起成為清遠市政府定點協(xié)議供貨商,電子采購供貨商
    3.公司2007年被清遠市相關(guān)政府部門評為安防行業(yè)狀元
    4.公司2007年起成為長城電腦清遠如意服務(wù)站(SP368)
    5.公司2007年承建清遠市橫河路口電子警察工程,開創(chuàng)清遠電子警察先河。
  • 6.公司2007年起成為IBM合作伙伴、公司2010年底成為金蝶軟件清遠金牌代理(伙伴編號:30030013)
    7.公司組團隊參加南方都市報組織的創(chuàng)富評選,獲廣東80強。公司申請多項軟件著作權(quán)、專利權(quán)
    8.2016年起公司成為粵東西北地區(qū)為數(shù)不多的雙軟企業(yè),確立“讓軟件驅(qū)動世界,讓智能改變生活!"企業(yè)理想
    9.2016-01-29更名為廣東互動電子網(wǎng)絡(luò)媒體有限公司
    10.2021-01-13更名為廣東互動電子有限公司
  • 投資合作咨詢熱線電話:0763-3391888 3323588
  • 做一個負責任的百年企業(yè)! 天行健,君子以自強不息;地勢坤,君子以厚德載物;
    為用戶創(chuàng)造價值! 讓軟件驅(qū)動世界; 讓智能改變生活; 超越顧客期望,幫助顧客成功;
    對客戶負責,對員工負責,對企業(yè)命運負責!幫助支持公司的客戶成功;幫助忠誠于公司的員工成功!
  • 聯(lián)系電話:0763-3391888 3323588 3318977
    服務(wù)熱線:18023314222 QQ:529623964
  • 工作QQ:2501204690 商務(wù)QQ: 602045550
    投資及業(yè)務(wù)投訴QQ: 529623964
    微信:小米哥 微信號:qysed3391888
    騰訊微博:桑達網(wǎng)絡(luò)-基石與起點
  • E-MAIL:222#QYSED.CN ok3391888#163.com (請用@替換#)
在線客服
  • 系統(tǒng)集成咨詢
    點擊這里給我發(fā)消息
  • 網(wǎng)站\微信\軟件咨詢
    點擊這里給我發(fā)消息
  • 售后服務(wù)
    點擊這里給我發(fā)消息
  • 投資合作
    點擊這里給我發(fā)消息