Weźmy sobie konstruktory takiego KafkaConsumer. Inicjowanie różnych pól napisane jest ciągiem, wielkie traje (try) na kilkadziesiąt linijek. Czy to nie powinno być wydzielone chociaż do prywatnych metod?

public KafkaConsumer(Map<String, Object> configs) {
        this((Map)configs, (Deserializer)null, (Deserializer)null);

    public KafkaConsumer(Map<String, Object> configs, Deserializer<K> keyDeserializer, Deserializer<V> valueDeserializer) {
        this(new ConsumerConfig(ConsumerConfig.addDeserializerToConfig(configs, keyDeserializer, valueDeserializer)), keyDeserializer, valueDeserializer);

    public KafkaConsumer(Properties properties) {
        this((Properties)properties, (Deserializer)null, (Deserializer)null);

    public KafkaConsumer(Properties properties, Deserializer<K> keyDeserializer, Deserializer<V> valueDeserializer) {
        this(new ConsumerConfig(ConsumerConfig.addDeserializerToConfig(properties, keyDeserializer, valueDeserializer)), keyDeserializer, valueDeserializer);

    private KafkaConsumer(ConsumerConfig config, Deserializer<K> keyDeserializer, Deserializer<V> valueDeserializer) {
        this.closed = false;
        this.currentThread = new AtomicLong(-1L);
        this.refcount = new AtomicInteger(0);

        try {
            GroupRebalanceConfig groupRebalanceConfig = new GroupRebalanceConfig(config, ProtocolType.CONSUMER);
            this.groupId = Optional.ofNullable(groupRebalanceConfig.groupId);
            this.clientId = buildClientId(config.getString("client.id"), groupRebalanceConfig);
            LogContext logContext;
            if (groupRebalanceConfig.groupInstanceId.isPresent()) {
                logContext = new LogContext("[Consumer instanceId=" + (String)groupRebalanceConfig.groupInstanceId.get() + ", clientId=" + this.clientId + ", groupId=" + (String)this.groupId.orElse("null") + "] ");
            } else {
                logContext = new LogContext("[Consumer clientId=" + this.clientId + ", groupId=" + (String)this.groupId.orElse("null") + "] ");

            this.log = logContext.logger(this.getClass());
            boolean enableAutoCommit = config.getBoolean("enable.auto.commit");
            if (!this.groupId.isPresent()) {
                if (!config.originals().containsKey("enable.auto.commit")) {
                    enableAutoCommit = false;
                } else if (enableAutoCommit) {
                    throw new InvalidConfigurationException("enable.auto.commit cannot be set to true when default group id (null) is used.");
            } else if (((String)this.groupId.get()).isEmpty()) {
                this.log.warn("Support for using the empty group id by consumers is deprecated and will be removed in the next major release.");

            this.log.debug("Initializing the Kafka consumer");
            this.requestTimeoutMs = (long)config.getInt("request.timeout.ms");
            this.defaultApiTimeoutMs = config.getInt("default.api.timeout.ms");
            this.time = Time.SYSTEM;
            this.metrics = buildMetrics(config, this.time, this.clientId);
            this.retryBackoffMs = config.getLong("retry.backoff.ms");
            Map<String, Object> userProvidedConfigs = config.originals();
            userProvidedConfigs.put("client.id", this.clientId);
            List<ConsumerInterceptor<K, V>> interceptorList = (new ConsumerConfig(userProvidedConfigs, false)).getConfiguredInstances("interceptor.classes", ConsumerInterceptor.class);
            this.interceptors = new ConsumerInterceptors(interceptorList);
            if (keyDeserializer == null) {
                this.keyDeserializer = (Deserializer)config.getConfiguredInstance("key.deserializer", Deserializer.class);
                this.keyDeserializer.configure(config.originals(), true);
            } else {
                this.keyDeserializer = keyDeserializer;

            if (valueDeserializer == null) {
                this.valueDeserializer = (Deserializer)config.getConfiguredInstance("value.deserializer", Deserializer.class);
                this.valueDeserializer.configure(config.originals(), false);
            } else {
                this.valueDeserializer = valueDeserializer;

            OffsetResetStrategy offsetResetStrategy = OffsetResetStrategy.valueOf(config.getString("auto.offset.reset").toUpperCase(Locale.ROOT));
            this.subscriptions = new SubscriptionState(logContext, offsetResetStrategy);
            ClusterResourceListeners clusterResourceListeners = this.configureClusterResourceListeners(keyDeserializer, valueDeserializer, this.metrics.reporters(), interceptorList);
            this.metadata = new ConsumerMetadata(this.retryBackoffMs, config.getLong("metadata.max.age.ms"), !config.getBoolean("exclude.internal.topics"), config.getBoolean("allow.auto.create.topics"), this.subscriptions, logContext, clusterResourceListeners);
            List<InetSocketAddress> addresses = ClientUtils.parseAndValidateAddresses(config.getList("bootstrap.servers"), config.getString("client.dns.lookup"));
            String metricGrpPrefix = "consumer";
            FetcherMetricsRegistry metricsRegistry = new FetcherMetricsRegistry(Collections.singleton("client-id"), metricGrpPrefix);
            ChannelBuilder channelBuilder = ClientUtils.createChannelBuilder(config, this.time, logContext);
            IsolationLevel isolationLevel = IsolationLevel.valueOf(config.getString("isolation.level").toUpperCase(Locale.ROOT));
            Sensor throttleTimeSensor = Fetcher.throttleTimeSensor(this.metrics, metricsRegistry);
            int heartbeatIntervalMs = config.getInt("heartbeat.interval.ms");
            ApiVersions apiVersions = new ApiVersions();
            NetworkClient netClient = new NetworkClient(new Selector(config.getLong("connections.max.idle.ms"), this.metrics, this.time, metricGrpPrefix, channelBuilder, logContext), this.metadata, this.clientId, 100, config.getLong("reconnect.backoff.ms"), config.getLong("reconnect.backoff.max.ms"), config.getInt("send.buffer.bytes"), config.getInt("receive.buffer.bytes"), config.getInt("request.timeout.ms"), ClientDnsLookup.forConfig(config.getString("client.dns.lookup")), this.time, true, apiVersions, throttleTimeSensor, logContext);
            this.client = new ConsumerNetworkClient(logContext, netClient, this.metadata, this.time, this.retryBackoffMs, config.getInt("request.timeout.ms"), heartbeatIntervalMs);
            this.assignors = PartitionAssignorAdapter.getAssignorInstances(config.getList("partition.assignment.strategy"), config.originals());
            this.coordinator = !this.groupId.isPresent() ? null : new ConsumerCoordinator(groupRebalanceConfig, logContext, this.client, this.assignors, this.metadata, this.subscriptions, this.metrics, metricGrpPrefix, this.time, enableAutoCommit, config.getInt("auto.commit.interval.ms"), this.interceptors);
            this.fetcher = new Fetcher(logContext, this.client, config.getInt("fetch.min.bytes"), config.getInt("fetch.max.bytes"), config.getInt("fetch.max.wait.ms"), config.getInt("max.partition.fetch.bytes"), config.getInt("max.poll.records"), config.getBoolean("check.crcs"), config.getString("client.rack"), this.keyDeserializer, this.valueDeserializer, this.metadata, this.subscriptions, this.metrics, metricsRegistry, this.time, this.retryBackoffMs, this.requestTimeoutMs, isolationLevel, apiVersions);
            this.kafkaConsumerMetrics = new KafkaConsumerMetrics(this.metrics, metricGrpPrefix);
            AppInfoParser.registerAppInfo("kafka.consumer", this.clientId, this.metrics, this.time.milliseconds());
            this.log.debug("Kafka consumer initialized");
        } catch (Throwable var20) {
            if (this.log != null) {
                this.close(0L, true);

            throw new KafkaException("Failed to construct kafka consumer", var20);

    KafkaConsumer(LogContext logContext, String clientId, ConsumerCoordinator coordinator, Deserializer<K> keyDeserializer, Deserializer<V> valueDeserializer, Fetcher<K, V> fetcher, ConsumerInterceptors<K, V> interceptors, Time time, ConsumerNetworkClient client, Metrics metrics, SubscriptionState subscriptions, ConsumerMetadata metadata, long retryBackoffMs, long requestTimeoutMs, int defaultApiTimeoutMs, List<ConsumerPartitionAssignor> assignors, String groupId) {
        this.closed = false;
        this.currentThread = new AtomicLong(-1L);
        this.refcount = new AtomicInteger(0);
        this.log = logContext.logger(this.getClass());
        this.clientId = clientId;
        this.coordinator = coordinator;
        this.keyDeserializer = keyDeserializer;
        this.valueDeserializer = valueDeserializer;
        this.fetcher = fetcher;
        this.interceptors = (ConsumerInterceptors)Objects.requireNonNull(interceptors);
        this.time = time;
        this.client = client;
        this.metrics = metrics;
        this.subscriptions = subscriptions;
        this.metadata = metadata;
        this.retryBackoffMs = retryBackoffMs;
        this.requestTimeoutMs = requestTimeoutMs;
        this.defaultApiTimeoutMs = defaultApiTimeoutMs;
        this.assignors = assignors;
        this.groupId = Optional.ofNullable(groupId);
        this.kafkaConsumerMetrics = new KafkaConsumerMetrics(metrics, "consumer");

Popraw, zrób Pull Requesta i wrzuć na forum to zerkniemy. Przy open source ciężko zachować dobrą jakość niestety, jeszcze zależy od aktywności ownerów repo.


Niezły kupsztal.

Ktoś coś dodaje, to boi się ruszyć tej kupy zależności, to dodaje nowego ifa i lecimy.


Nic nie ma czystego kodu. Czysty kod produkują tylko mądrale z tego forum, ale nikt tego nie widział, bo tego kodu nie pokazują, tylko się mądrzą. Android ma straszliwy kod np, java też, .net tak samo. To czemu Kafka ma mieć czysty kod dla odmiany?

Zrób test: weź kawałek kodu z jakiegokolwiek projektu czy biblioteki używanej przez miliony programistów, wytnij go i daj tu do oceny. Zostaniesz zmieszany z błotem, że wszystko źle.


No, ale Kafkę napisał Linkedin, więc to nie był open source od początku.
To z czego polecalibyście się uczyć?
Zasubskrybowałem Kafkę i czytam te ich Jiry i commity, ale skoro kaszana jest to lepiej żebym nie brał przykładu. Może jakieś googlowe projekty będą lepsze?

O to mi się podoba:

@Meini: nie przesadzaj. Oczywiście że są projekty w których jest czysty kod. Przy czym "czysty" to pojęcie względne i zawsze znajdzie się coś do poprawy lub co inna osoba zastąpiła by alternatywnym kodem. Ale tak ogólnie to jak najbardziej stosuje się czysty kod w różnych projektach. Chociażby w projekcie w którym ja pracuję na próżno byś szukał długich metod z wymieszaną odpowiedzialnością. Dla mnie np. metoda która ma więcej niż 20 linii na oko zapala wewnętrzna czerwoną lampkę i sprawdzam czy czasem za dużo się w niej nie dzieje- w większości przypadków tak właśnie jest i wydzielam część kodu do odrębnej metody (lub metod).


No tak, w projekcie w którym ty pracujesz, tylko nikt go nie widział. Ty umiesz czysty kod, ale nie pokażesz, a Google nie umie i np Androida napisał źle. O tym mówię przecież.

Patrząc na to z boku: tu gdzie pracują szeregowi programiści, piszą czysty kod dla swoich firm. A wielcy robią tylko kupę, bo inaczej nie umią czyli ci szeregowi są lepsi pewnie


Mam dzielić się prywatnym kodem firmy który nie należy do mnie? Dobre żarty... Jeśli chodzi o jakiś kod na GH to sprawa jest prosta- nie mam żadnego większego projektu napisanego prywatnie. Poza tym w kwestii gorszych praktyk w kodzie frameworków to również sprawa jest prosta- tam często celem nadrzędnym jest wydajność, i jest to dostarczane właśnie kosztem jakości kodu (i co za tym idzie również większą możliwością bugów). Ja piszę kod biznesowy. Jego wydajność jest zapewniona przede wszystkim dzięki frameworkom i odpowiedniej architekturze, a nie szczegółom implementacyjnym. Kod biznesowy ma być właśnie czytelny, czysty i spójny z domeną którą obsługuje- to jest właśnie to na co jest czas i środki, wydajność to sprawa drugorzędna. Problemy wydajnościowe naprawia się dopiero kiedy one się pojawią, a pojawiają się rzadko właśnie dzięki temu że korzysta się z gotowych rozwiązań.


Bo najlepiej jakby Kafka nie byla napisana w Javie ;)
stąd pomysły jak RedPanda od https://vectorized.io/ heh

a kod który musi miec wysoki performance czesto jest brzydki tak czy inaczej

jeszcze mi sie przypomnialo... GOTO tez jest brzydkie co nie? https://manybutfinite.com/post/goto-and-the-folly-of-dogma/

a dla wiekszego mindfucku:
"Why Every Element of SOLID is Wrong" https://speakerdeck.com/tastapod/why-every-element-of-solid-is-wrong
"It's probably time to stop recommending Clean Code" https://qntm.org/clean
IT depends, always.

Odnosnie GOTO jak ktos lubi takie ciekawostki:

Title of "GO TO Statement considered harmful" https://www.cs.utexas.edu/users/EWD/transcriptions/EWD02xx/EWD215.html was "A Case against the GO TO Statement", Dijkstra mentioned it in the last paragraph here http://www.cs.utexas.edu/users/EWD/transcriptions/EWD13xx/EWD1308.html
"Finally a short story for the record. In 1968, the Communications of the ACM published a text of mine under the title "The goto statement considered harmful", which in later years would be most frequently referenced, regrettably, however, often by authors who had seen no more of it than its title, which became a cornerstone of my fame by becoming a template: we would see all sorts of articles under the title "X considered harmful" for almost any X, including one titled "Dijkstra considered harmful". But what had happened? I had submitted a paper under the title "A case against the goto statement", which, in order to speed up its publication, the editor had changed into a "letter to the Editor", and in the process he had given it a new title of his own invention! The editor was Niklaus Wirth."

karsa napisał(a):

Bo najlepiej jakby Kafka nie byla napisana w Javie ;)

Pytanie z ciekawości - czemu?

W czym byś nie napisał Kafki to będą problemy. Java w tej kwestii ma jedną dużą zaletę - jest ich relatywnie mało, a jak wystąpią to zazwyczaj dość łatwo namierzyć czy stwierdzić co poszło nie tak.

karsa napisał(a):

a kod który musi miec wysoki performance czesto jest brzydki tak czy inaczej

Jeśli, aby osiągnąć dobrą wydajność musisz pisać brzydki kod
to znaczy, że kompilator/jezyk obsysa - praktycznie wszystkie współczesne (2020) kompilatory to niestety dramat na jakimś poziomie. Ale ciągle jest postęp, wiele rzeczy, które kiedyś trzeba było robić ręcznie (asm/c ) sdą obecnie ładnie załatwiane na wyższym poziomie (np. naprawdę wydajne użycie rejestrów).

Co do GOTO considered harmfull to imo już dawno minęliśmy ten punkt, że goto jest potrzebne ze względów wydajnościowych.

Krytyka SOLID - sensowna, mam od dawna bardzo podobne przemyślenia (tylko nie chce otwierać tego frontu :-)) - z wyjątkiem ostatniego punktu - Dependency Inversion w żadnym razie nie prowadzi to używania frameworków, to tylko wynaturzenie, które zdarzyło się w javie.

