如何确定Kafka的分区数，key和consumer线程数

如题所述

举报该文章

相关建议 2017-04-29

ä¸ãå®¢æ·ç«¯/æå¡å¨ç«¯éè¦ä½¿ç¨çååå°±è¶å¤
åè¯´è¯´å®¢æ·ç«¯çæåµãKafka 0.8.2ä¹åæ¨åºäºJavaççå¨æ°çproducerï¼è¿ä¸ªproduceræä¸ªåæ°batch.sizeï¼é»è®¤æ¯16KBãå®ä¼ä¸ºæ¯ä¸ªååºç¼åæ¶æ¯ï¼ä¸æ¦æ»¡äºå°±æåå°æ¶æ¯æ¹éååºãçä¸å»è¿æ¯ä¸ªè½å¤æåæ§è½çè®¾è®¡ãä¸è¿å¾æ¾ç¶ï¼å ä¸ºè¿ä¸ªåæ°æ¯ååºçº§å«çï¼å¦æååºæ°è¶å¤ï¼è¿é¨åç¼åæéçååå ç¨ä¹ä¼æ´å¤ãåè®¾ä½ æ10000ä¸ªååºï¼æç§é»è®¤è®¾ç½®ï¼è¿é¨åç¼åéè¦å ç¨çº¦157MBçååãèconsumerç«¯å¢ï¼æä»¬æå¼è·åæ°æ®æéçååä¸è¯´ï¼åªè¯´çº¿ç¨çå¼éãå¦æè¿æ¯åè®¾æ10000ä¸ªååºï¼åæ¶consumerçº¿ç¨æ°è¦å¹éååºæ°(å¤§é¨åæåµä¸æ¯æä½³çæ¶è´¹ååééç½®)çè¯ï¼é£ä¹å¨consumer clientå°±è¦åå»º10000ä¸ªçº¿ç¨ï¼ä¹éè¦åå»ºå¤§çº¦10000ä¸ªSocketå»è·åååºæ°æ®ãè¿éé¢ççº¿ç¨åæ¢çå¼éæ¬èº«å·²ç»ä¸å®¹å°è§äºã
æå¡å¨ç«¯çå¼éä¹ä¸å°ï¼å¦æéè¯»Kafkaæºç çè¯å¯ä»¥åç°ï¼æå¡å¨ç«¯çå¾å¤ç»ä»¶é½å¨ååä¸ç»´æ¤äºååºçº§å«çç¼åï¼æ¯å¦controllerï¼FetcherManagerçï¼å æ¤ååºæ°è¶å¤ï¼è¿ç§ç¼åçææ¬è¶ä¹è¶å¤§ã
äºãæä»¶å¥æçå¼é
æ¯ä¸ªååºå¨åºå±æä»¶ç³»ç»é½æå±äºèªå·±çä¸ä¸ªç®å½ãè¯¥ç®å½ä¸éå¸¸ä¼æä¸¤ä¸ªæä»¶ï¼ base_offset.logåbase_offset.indexãKafakçcontrolleråReplicaManagerä¼ä¸ºæ¯ä¸ªbrokeré½ä¿åè¿ä¸¤ä¸ªæä»¶å¥æ(file handler)ãå¾ææ¾ï¼å¦æååºæ°è¶å¤ï¼æéè¦ä¿ææå¼ç¶æçæä»¶å¥ææ°ä¹å°±è¶å¤ï¼æç»å¯è½ä¼çªç ´ä½ çulimit -nçéå¶ã
ä¸ãéä½é«å¯ç¨æ§
Kafkaéè¿å¯æ¬(replica)æºå¶æ¥ä¿è¯é«å¯ç¨ãå·ä½åæ³å°±æ¯ä¸ºæ¯ä¸ªååºä¿åè¥å¹²ä¸ªå¯æ¬(replica_factoræå®å¯æ¬æ°)ãæ¯ä¸ªå¯æ¬ä¿åå¨ä¸åçbrokerä¸ãæä¸çä¸ä¸ªå¯æ¬åå½leader å¯æ¬ï¼è´è´£å¤çproduceråconsumerè¯·æ±ãå¶ä»å¯æ¬åå½followerè§è²ï¼ç±Kafka controllerè´è´£ä¿è¯ä¸leaderçåæ¥ãå¦æleaderæå¨çbrokerææäºï¼contorllerä¼æ£æµå°ç¶åå¨zookeeperçå¸®å©ä¸ééåºæ°çleaderââè¿ä¸é´ä¼æçæçä¸å¯ç¨æ¶é´çªå£ï¼è½ç¶å¤§é¨åæåµä¸å¯è½åªæ¯å æ¯«ç§çº§å«ãä½å¦æä½ æ10000ä¸ªååºï¼10ä¸ªbrokerï¼ä¹å°±æ¯è¯´å¹³åæ¯ä¸ªbrokerä¸æ1000ä¸ªååºãæ¤æ¶è¿ä¸ªbrokerææäºï¼é£ä¹zookeeperåcontrolleréè¦ç«å³å¯¹è¿1000ä¸ªååºè¿è¡leaderéä¸¾ãæ¯èµ·å¾å°çååºleaderéä¸¾èè¨ï¼è¿å¿ç¶è¦è±æ´é¿çæ¶é´ï¼å¹¶ä¸éå¸¸ä¸æ¯çº¿æ§ç´¯å çãå¦æè¿ä¸ªbrokerè¿åæ¶æ¯controlleræåµå°±æ´ç³äºã
è¯´äºè¿ä¹å¤âåºè¯âï¼å¾å¤äººè¯å®å·²ç»ä¸èç¦äºãé£ä½ è¯´å°åºè¦æä¹ç¡®å®ååºæ°å¢ï¼çæ¡å°±æ¯ï¼è§æåµèå®ãåºæ¬ä¸ä½ è¿æ¯éè¦éè¿ä¸ç³»åå®éªåæµè¯æ¥ç¡®å®ãå½ç¶æµè¯çä¾æ®åºè¯¥æ¯ååéãè½ç¶LinkedInè¿ç¯æç« åäºKafkaçåºåæµè¯ï¼ä½å®çç»æå¶å®å¯¹ä½ æä¹ä¸å¤§ï¼å ä¸ºä¸åçç¡¬ä»¶ãè½¯ä»¶ãè´è½½æåµæµè¯åºæ¥çç»æå¿ç¶ä¸ä¸æ ·ãæç»å¸¸ç¢°å°çé®é¢ç±»ä¼¼äºï¼å®ç½è¯´æ¯ç§è½å°10MBï¼ä¸ºä»ä¹æçproduceræ¯ç§æ1MBï¼ ââ ä¸ä¸è¯´ç¡¬ä»¶æ¡ä»¶ï¼æååç°ä»ä½¿ç¨çæ¶æ¯ä½æ1KBï¼èå®ç½çåºåæµè¯æ¯ç¨100Bæµåºæ¥çï¼å æ¤æ ¹æ¬æ²¡æå¯æ¯æ§ãä¸è¿ä½ ä¾ç¶å¯ä»¥éµå¾ªä¸å®çæ¥éª¤æ¥å°è¯ç¡®å®ååºæ°ï¼åå»ºä¸ä¸ªåªæ1ä¸ªååºçtopicï¼ç¶åæµè¯è¿ä¸ªtopicçproducerååéåconsumerååéãåè®¾å®ä»¬çå¼åå«æ¯TpåTcï¼åä½å¯ä»¥æ¯MB/sãç¶ååè®¾æ»çç®æ ååéæ¯Ttï¼é£ä¹ååºæ° = Tt / max(Tp, Tc)
Tpè¡¨ç¤ºproducerçååéãæµè¯produceréå¸¸æ¯å¾å®¹æçï¼å ä¸ºå®çé»è¾éå¸¸ç®åï¼å°±æ¯ç´æ¥åéæ¶æ¯å°Kafkaå°±å¥½äºãTcè¡¨ç¤ºconsumerçååéãæµè¯Tcéå¸¸ä¸åºç¨çå³ç³»æ´å¤§ï¼ å ä¸ºTcçå¼åå³äºä½ æ¿å°æ¶æ¯ä¹åæ§è¡ä»ä¹æä½ï¼å æ¤Tcçæµè¯éå¸¸ä¹è¦éº»ç¦ä¸äºã
å¦å¤ï¼Kafkaå¹¶ä¸è½çæ£å°åå°çº¿æ§æ©å±(å¶å®ä»»ä½ç³»ç»é½ä¸è½)ï¼æä»¥ä½ å¨è§åä½ çååºæ°çæ¶åæå¥½å¤è§åä¸ä¸ï¼è¿æ ·æªæ¥æ©å±æ¶åä¹æ´å æ¹ä¾¿ã
æ¶æ¯-ååºçåé
é»è®¤æåµä¸ï¼Kafkaæ ¹æ®ä¼ éæ¶æ¯çkeyæ¥è¿è¡ååºçåéï¼å³hash(key) % numPartitionsï¼å¦ä¸å¾æç¤º:
def partition(key: Any, numPartitions: Int): Int = {
Utils.abs(key.hashCode) % numPartitions
}
è¿å°±ä¿è¯äºç¸åkeyçæ¶æ¯ä¸å®ä¼è¢«è·¯ç±å°ç¸åçååºãå¦æä½ æ²¡ææå®keyï¼é£ä¹Kafkaæ¯å¦ä½ç¡®å®è¿æ¡æ¶æ¯å»å¾åªä¸ªååºçå¢ï¼
å¤å¶ä»£ç
if(key == null) { // å¦ææ²¡ææå®key
val id = sendPartitionPerTopicCache.get(topic) // åççKafkaææ²¡æç¼åçç°æçååºId
id match {
case Some(partitionId) =>
partitionId // å¦ææçè¯ç´æ¥ä½¿ç¨è¿ä¸ªååºIdå°±å¥½äº
case None => // å¦ææ²¡æçè¯ï¼
val availablePartitions = topicPartitionList.filter(_.leaderBrokerIdOpt.isDefined) //æ¾åºææå¯ç¨ååºçleaderæå¨çbroker
if (availablePartitions.isEmpty)
throw new LeaderNotAvailableException("No leader for any partition in topic " + topic)
val index = Utils.abs(Random.nextInt) % availablePartitions.size // ä»ä¸éæºæä¸ä¸ª
val partitionId = availablePartitions(index).partitionId
sendPartitionPerTopicCache.put(topic, partitionId) // æ´æ°ç¼åä»¥å¤ä¸ä¸æ¬¡ç´æ¥ä½¿ç¨
partitionId
}
}
å¤å¶ä»£ç
å¯ä»¥çåºï¼Kafkaå ä¹å°±æ¯éæºæ¾ä¸ä¸ªååºåéæ keyçæ¶æ¯ï¼ç¶åæè¿ä¸ªååºå·å å¥å°ç¼åä¸ä»¥å¤åé¢ç´æ¥ä½¿ç¨ââå½ç¶äºï¼Kafkaæ¬èº«ä¹ä¼æ¸ç©ºè¯¥ç¼åï¼é»è®¤æ¯10åéææ¯æ¬¡è¯·æ±topicåæ°æ®æ¶ï¼
å¦ä½è®¾å®consumerçº¿ç¨æ°
æä¸ªäººçè§ç¹ï¼å¦æä½ çååºæ°æ¯Nï¼é£ä¹æå¥½çº¿ç¨æ°ä¹ä¿æä¸ºNï¼è¿æ ·éå¸¸è½å¤è¾¾å°æå¤§çååéãè¶è¿Nçéç½®åªæ¯æµªè´¹ç³»ç»èµæºï¼å ä¸ºå¤åºççº¿ç¨ä¸ä¼è¢«åéå°ä»»ä½ååºãè®©æä»¬æ¥ççå·ä½Kafkaæ¯å¦ä½åéçã
topicä¸çä¸ä¸ªååºåªè½è¢«åä¸ä¸ªconsumer groupä¸çä¸ä¸ªconsumerçº¿ç¨æ¥æ¶è´¹ï¼ä½åä¹å¹¶ä¸æç«ï¼å³ä¸ä¸ªconsumerçº¿ç¨å¯ä»¥æ¶è´¹å¤ä¸ªååºçæ°æ®ï¼æ¯å¦Kafkaæä¾çConsoleConsumerï¼é»è®¤å°±åªæ¯ä¸ä¸ªçº¿ç¨æ¥æ¶è´¹ææååºçæ°æ®ãââå¶å®ConsoleConsumerå¯ä»¥ä½¿ç¨ééç¬¦çåè½å®ç°åæ¶æ¶è´¹å¤ä¸ªtopicæ°æ®ï¼ä½è¿åæ¬ææ å³ã
åè®¨è®ºåéçç¥ä¹åï¼åè¯´è¯´KafkaStreamââå®æ¯consumerçå³é®ç±»ï¼æä¾äºéåæ¹æ³ç¨äºconsumerç¨åºè°ç¨å®ç°æ°æ®çæ¶è´¹ãå¶åºå±ç»´æ¤äºä¸ä¸ªé»å¡éåï¼æä»¥å¨æ²¡ææ°æ¶æ¯å°æ¥æ¶ï¼consumeræ¯å¤äºé»å¡ç¶æçï¼è¡¨ç°åºæ¥çç¶æå°±æ¯consumerç¨åºä¸ç´å¨çå¾æ°æ¶æ¯çå°æ¥ãââä½ å½ç¶å¯ä»¥éç½®æå¸¦è¶æ¶çconsumerï¼å·ä½åçåæ°consumer.timeout.msçç¨æ³ã
ä¸é¢è¯´è¯´Kafkaæä¾çä¸¤ç§åéçç¥ï¼ rangeåroundrobinï¼ç±åæ°partition.assignment.strategyæå®ï¼é»è®¤æ¯rangeçç¥ãæ¬æåªè®¨è®ºrangeçç¥ãæè°çrangeå¶å®å°±æ¯æç§é¶æ®µå¹³ååéãä¸¾ä¸ªä¾åå°±æç½äºï¼åè®¾ä½ æ10ä¸ªååºï¼P0 ~ P9ï¼consumerçº¿ç¨æ°æ¯3ï¼ C0 ~ C2ï¼é£ä¹æ¯ä¸ªçº¿ç¨é½åéåªäºååºå¢ï¼
C0 æ¶è´¹ååº 0, 1, 2, 3
C1 æ¶è´¹ååº 4, 5, 6
C2 æ¶è´¹ååº 7, 8, 9
å·ä½ç®æ³å°±æ¯ï¼
å¤å¶ä»£ç
val nPartsPerConsumer = curPartitions.size / curConsumers.size // æ¯ä¸ªconsumerè³å°ä¿è¯æ¶è´¹çååºæ°
val nConsumersWithExtraPart = curPartitions.size % curConsumers.size // è¿å©ä¸å¤å°ä¸ªååºéè¦åç¬åéç»å¼å¤´ççº¿ç¨ä»¬
...
for (consumerThreadId <- consumerThreadIdSet) { // å¯¹äºæ¯ä¸ä¸ªconsumerçº¿ç¨
val myConsumerPosition = curConsumers.indexOf(consumerThreadId) //ç®åºè¯¥çº¿ç¨å¨ææçº¿ç¨ä¸çä½ç½®ï¼ä»äº[0, n-1]
assert(myConsumerPosition >= 0)
// startPart å°±æ¯è¿ä¸ªçº¿ç¨è¦æ¶è´¹çèµ·å§ååºæ°
val startPart = nPartsPerConsumer * myConsumerPosition + myConsumerPosition.min(nConsumersWithExtraPart)
// nParts å°±æ¯è¿ä¸ªçº¿ç¨æ»å±è¦æ¶è´¹å¤å°ä¸ªååº
val nParts = nPartsPerConsumer + (if (myConsumerPosition + 1 > nConsumersWithExtraPart) 0 else 1)
...
}
å¤å¶ä»£ç
éå¯¹äºè¿ä¸ªä¾åï¼nPartsPerConsumerå°±æ¯10/3=3ï¼nConsumersWithExtraPartä¸º10%3=1ï¼è¯´ææ¯ä¸ªçº¿ç¨è³å°ä¿è¯3ä¸ªååºï¼è¿å©ä¸1ä¸ªååºéè¦åç¬åéç»å¼å¤´çè¥å¹²ä¸ªçº¿ç¨ãè¿å°±æ¯ä¸ºä»ä¹C0æ¶è´¹4ä¸ªååºï¼åé¢ç2ä¸ªçº¿ç¨æ¯ä¸ªæ¶è´¹3ä¸ªååºï¼å·ä½è¿ç¨è¯¦è§ä¸é¢çDebugæªå¾ä¿¡æ¯ï¼
ctx.myTopicThreadIds
nPartsPerConsumer = 10 / 3 = 3
nConsumersWithExtraPart = 10 % 3 = 1
ç¬¬ä¸æ¬¡ï¼
myConsumerPosition = 1
startPart = 1 * 3 + min(1, 1) = 4 ---ä¹å°±æ¯ä»ååº4å¼å§è¯»
nParts = 3 + (if (1 + 1 > 1) 0 else 1) = 3 è¯»å3ä¸ªååºï¼ å³4,5,6
ç¬¬äºæ¬¡ï¼
myConsumerPosition = 0
startPart = 3 * 0 + min(1, 0) =0 --- ä»ååº0å¼å§è¯»
nParts = 3 + (if (0 + 1 > 1) 0 else 1) = 4 è¯»å4ä¸ªååºï¼å³0,1,2,3
ç¬¬ä¸æ¬¡ï¼
myConsumerPosition = 2
startPart = 3 * 2 + min(2, 1) = 7 --- ä»ååº7å¼å§è¯»
nParts = 3 + if (2 + 1 > 1) 0 else 1) = 3 è¯»å3ä¸ªååºï¼å³7, 8, 9
è³æ¤10ä¸ªååºé½å·²ç»åéå®æ¯
è¯´å°è¿éï¼ç»å¸¸æä¸ªéæ±å°±æ¯ææ³è®©æä¸ªconsumerçº¿ç¨æ¶è´¹æå®çååºèä¸æ¶è´¹å¶ä»çååºãå¦çæ¥è¯´ï¼ç®åKafkaå¹¶æ²¡ææä¾èªå®ä¹åéçç¥ãåå°è¿ç¹å¾é¾ï¼ä½ä»ç»æ³ä¸æ³ï¼ä¹è®¸æä»¬ææKafkaåçäºæå¤ªå¤äºï¼æ¯ç«å®åªæ¯ä¸ªæ¶æ¯å¼æï¼å¨Kafkaä¸å å¥æ¶æ¯æ¶è´¹çé»è¾ä¹è®¸å¹¶ä¸æ¯Kafkaè¯¥åçäºæã

温馨提示：内容为网友见解，仅供参考

当前网址：https://22.t2y.org/zz/xs2xiihsticshi0icf.html

其他看法

无其他回答

如何确定Kafka的分区数,key和consumer线程数
可以看出，Kafka几乎就是随机找一个分区发送无key的消息，然后把这个分区号加入到缓存中以备后面直接使用——当然了，Kafka本身也会清空该缓存（默认每10分钟或每次请求topic元数据时）如何设定consumer线程数我个人的观点，如果你的分区数是N，那么最好线程数也保持为N，这样通常能够达到最大的吞吐量。...

如何确定Kafka的分区数,key和consumer线程数
分区实际上是调优Kafka并行度的最小单元。对于producer而言，它实际上是用多个线程并发地向不同分区所在的broker发起Socket连接同时给这些分区发送消息；而consumer呢，同一个消费组内的所有consumer线程都被指定topic的某一个分区进行消费(具体如何确定consumer线程数目我们后面会详细说明)。所以说，如果一个...

如何确定Kafka的分区数,key和consumer线程数
如果还是假设有10000个分区，同时consumer线程数要匹配分区数(大部分情况下是最佳的消费吞吐量配置)的话，那么在consumer client就要创建10000个线程，也需要创建大约10000个Socket去获取分区数据。这里面的线程切换的开销本身已经不容小觑了。服务器端的开销也不小，如果阅读Kafka源码的话可以发现，服务器端的...

Kafka分区数量设置详解
确定分区数量时，可根据topic的producer吞吐量（Tp）和consumer吞吐量（Tc）计算，目标吞吐量（Tt）除以max(Tp, Tc)即为分区数。消息分配到分区基于key值，相同key的消息被路由到同一分区，key为null时随机选择分区。默认的分区分配策略是range，优先级为消费者线程数量，分区按序号排序，消费者按字母顺序...

如何为一个kafka集群选择topics\/partitions的数量
这个延迟需要体现在两个boker间主备数据同步。在默认情况下，两个boker只有一个线程负责数据的复制。根据经验，每个boker上的分区限制在100*b*r内（b指集群内boker的数量，r指副本数量）。分区多会增加客户端的内存消耗 kafka0.8.2后有个比较好的特色，新的Producer可以允许用户设置一个缓冲区，缓存...

kafka分区数量限制
可以遵循一定的步骤来尝试确定分区数：创建一个只有1个分区的topic，然后测试这个topic的producer吞吐量和consumer吞吐量。假设它们的值分别是Tp和Tc，单位可以是MB\/s。然后假设总的目标吞吐量是Tt，那么分区数 = Tt \/ max(Tp, Tc)使用压测工具，得出最佳分区数 kafka官方也提供了脚本方便我们针对我们...

kafka架构详解
- kafka集群可以有1个或多个Broker - Broker 可以包含多个副本（每个分区可以包含多个副本，通常每个分区副本数不会多于Broker数量，一个broker中包含很多个分区）- Topic可以有1个或多个分区 - broker中的每个partition可以有0个或1个副本 - 一个partition有一个leader副本和0个或多个follower副本 - ...

Kafka partition的数量问题
在kafka的数据日志文件目录中，每个日志数据段都会分配两个文件，一个索引文件和一个数据文件。因此，随着partition的增多，需要的文件句柄数急剧增加，必要时需要调整操作系统允许打开的文件句柄数。更多的分区会导致端对端的延迟 kafka端对端的延迟为producer端发布消息到consumer端消费消息所需的时间，即...

kafka配置参数详解
kafka的配置分为 broker、producter、consumer三个不同的配置一 BROKER 的全局配置最为核心的三个配置 broker.id、log.dir、zookeeper.connect 。--- 系统相关 --- broker.id =1 log.dirs = \/tmp\/kafka-logs port =6667 message.max.bytes =1000000 num.network.threads =3 num.io.threa...

Kafka整体架构图解
要理解Kafka，首先需明白其架构核心。它包含Producer、Broker和Consumer，每个Producer可写多个Topic，每个Consumer只能属于一个Consumer Group。整个系统通过ZooKeeper进行配置管理，确保数据在多个Broker间分布式存储和读取。每个Topic由多个分区（Partition）组成，分区间采用顺序写入和有序性保证。Producer根据Key值...