Elasticsearch interview soruları ve cevapları

Elasticsearch, ölçeklenebilir ve gerçek zamanlı bir arama ve analitik motoru olan açık kaynaklı bir yazılımdır. Elasticsearch mülakatları genellikle bu teknolojiye ilişkin teknik bilgiyi ölçer. İşte birkaç olası soru ve bu sorulara verilebilecek cevaplar:

Elasticsearch nedir ve ne için kullanılır?

Cevap: Elasticsearch, büyük veri miktarları üzerinde hızlı ve ölçeklenebilir arama ve analiz yetenekleri sağlayan bir açık kaynaklı arama ve analitik motorudur. Elasticsearch, çok çeşitli kullanım durumları için uygundur, örneğin uygulama araması, loj analizi, iş zekası, güvenlik istihbaratı ve daha fazlası.

Elasticsearch'in bir NoSQL veritabanı olarak nasıl işlediğini açıklayabilir misiniz?

Cevap: Elasticsearch, bir NoSQL veritabanı olarak, geleneksel tablo-tabanlı SQL veritabanlarından farklı olarak, verileri belge tabanlı bir format olan JSON'da saklar. Bu, daha karmaşık ve değişken veri yapılarına izin verir. Elasticsearch ayrıca, tüm verileri hızlı bir şekilde aramak ve analiz etmek için ters indeksleme kullanır.

Sharding ve Replication Elasticsearch'da ne anlama gelir?

Cevap: Sharding, bir Elasticsearch indeksini birden fazla parçaya bölme sürecidir. Bu, verinin dağıtılmasına ve paralel işleme yeteneğine olanak sağlar, bu da daha iyi performans ve ölçeklenebilirlik sağlar. Replication ise, veri kaybını önlemek ve yüksek kullanılabilirlik sağlamak için bir indeksin kopyalarını oluşturma sürecidir.

Inverted Index Elasticsearch'da ne anlama gelir?

Cevap: Elasticsearch'teki inverted index, bir kelimenin belgenin hangi parçasında bulunduğunu hızlı bir şekilde belirlemeyi sağlar. Bu, bir arama motorunun belirli bir kelimenin veya ifadenin belgelerde nerede bulunduğunu hızlı bir şekilde bulmasını sağlar.

Elasticsearch'de bir mapping nedir?

Cevap: Elasticsearch'de, bir mapping, belge ve belge içindeki alanların nasıl indekslendiğini ve saklandığını tanımlayan bir schema'dır. Mapping, bir alanın veri tipini, analiz edilip edilmeyeceğini ve eğer analiz ediliyorsa hangi analizörün kullanılacağını belirler.

Elasticsearch ve SQL arasındaki farklar nelerdir?

Cevap: Elasticsearch ve SQL, veri depolama ve sorgulama için farklı yaklaşımlara sahip olan iki farklı teknolojidir. İşte Elasticsearch ve SQL arasındaki temel farklar:

-Veri Yapısı ve Modelleme: Elasticsearch, belge tabanlı bir NoSQL veritabanıdır. Veriler JSON formatında belgelere kaydedilir. Her belge kendi alanlarına sahiptir ve alanların veri türleri belirtilmez. Bu, esnek veri modellemesine ve dinamik alan eklemeye olanak tanır. SQL ise tablo-tabanlı bir veritabanıdır. Veriler tablolarda sütunlar ve satırlar şeklinde düzenlenir ve ilişkisel şemaya dayanır.

-Arama ve Sorgulama: Elasticsearch, hızlı ve karmaşık metin tabanlı arama ve sorgulama yetenekleri sağlar. Elasticsearch, tam metin arama, eşleme, aralık sorguları, filtrelemeler, aggreate sorguları ve daha fazlasını destekler. SQL ise yapılandırılmış sorgular için tasarlanmıştır. SQL dilinde, SELECT, INSERT, UPDATE, DELETE gibi ifadeler kullanılarak veri tabanından veri çekme, ekleme, güncelleme ve silme işlemleri gerçekleştirilir.

-Ölçeklenebilirlik: Elasticsearch, dağıtılmış bir arama motoru olduğu için yüksek ölçeklenebilirlik sağlar. Verileri otomatik olarak birden fazla sunucu üzerinde bölüştürerek büyük veri kümelerini işleyebilir. SQL veritabanları da ölçeklenebilir olabilir, ancak genellikle dikey ölçeklenme (sunucu gücünü artırma) gerektirir.

-Yapılandırma ve Yönetim: Elasticsearch, yapılandırması ve yönetimi kolay olan bir açık kaynaklı yazılımdır. İyi bir Elasticsearch kümesi kurmak ve yönetmek, karmaşıklığı SQL veritabanlarından daha az olabilir. SQL veritabanları genellikle daha fazla yapılandırma ve yönetim gerektirir.

-Veri Saklama ve İndeksleme: Elasticsearch, verileri tam metin indeksleme yöntemiyle saklar ve hızlı bir şekilde aramak için ters indeksleme kullanır. SQL veritabanlarında ise veriler genellikle tablolar içinde sütun ve satırlar şeklinde saklanır.

-Kullanım Senaryoları: Elasticsearch, özellikle metin tabanlı arama, log analizi, iş zekası ve gerçek zamanlı veri analitiği gibi kullanım senaryoları için idealdir. SQL ise genellikle yapılandırılmış veri depolama ve işleme için daha yaygın olarak kullanılır.

Elasticsearch'da bir "node" nedir?

Cevap: Elasticsearch'da bir "node", Elasticsearch örneğini çalıştıran tek bir sunucu olarak tanımlanır. Birden çok node bir araya gelerek bir "cluster" oluşturur. Node'lar farklı roller alabilirler; örneğin, veri node'ları veri saklar ve arama/agregasyon işlemlerine katılır, master node'lar cluster yönetimine katılır ve ingest node'lar veriyi işler ve indeksler.

Elasticsearch'da bir "cluster" nedir?

Cevap: Elasticsearch'da bir "cluster", birden çok node'un bir araya geldiği ve birlikte çalıştığı bir grup olarak tanımlanır. Bir cluster, verileri birden çok node arasında dağıtarak yüksek ölçeklenebilirlik ve kullanılabilirlik sağlar.

Elasticsearch'da anlık görüntü (snapshot) ve geri yükleme (restore) işlemlerinin ne olduğunu açıklayabilir misiniz?

Cevap: Elasticsearch'da, anlık görüntü (snapshot), bir ya da daha fazla indeksin belirli bir zaman noktasındaki durumunu saklar ve bu bir veya daha fazla yedeği içerebilir. Geri yükleme işlemi, bir anlık görüntüyü kullanarak indeksleri önceki bir duruma geri yükler. Bu, veri kaybı durumlarında veya test amaçlı durumlarda kullanışlıdır.

Elasticsearch'de "filter" ve "query" arasındaki fark nedir?

Cevap: Elasticsearch'de, hem "filter" hem de "query" belirli bir kriteri karşılayan belgeleri bulmak için kullanılır. Ancak, bir "query" aynı zamanda her belgeye bir relevans skoru atar, yani belgenin sorguyla ne kadar iyi eşleştiğini belirler. Öte yandan, bir "filter" sadece belirli bir kriteri karşılayan belgeleri döndürür, skorlama yapmaz ve genellikle daha hızlıdır çünkü sonuçları önbelleğe alabilir.

Elasticsearch'da "relevance score" ne demektir?

Cevap: Elasticsearch'da, "relevance score" belgenin bir sorguyla ne kadar iyi eşleştiğini gösteren bir skordur. Bu skor, bir sorgunun sonuçlarını sıralamak için kullanılır, böylece en alakalı belgeler en üstte gösterilir. Relevance score, bir dizi faktöre bağlıdır, örneğin, arama teriminin belgedeki sıklığı veya belgedeki toplam kelime sayısı.

"Mapping" ve "indexing" arasındaki fark nedir?

Cevap: Elasticsearch'da, "mapping" bir indeksin içerisindeki belgelerin nasıl depolandığı ve indekslendiği ile ilgili kuralları belirler. Diğer yandan, "indexing" belgeleri bir indekse eklemeyi ve bu belgeleri aranabilir hale getirmeyi ifade eder.

Elasticsearch'da analizörler (analyzers) ne işe yarar?

Cevap: Elasticsearch'da, analizörler bir belgenin indekslenmesi veya sorgulanması sırasında metni nasıl işleneceğini belirler. Bir analizör, bir karakter filtresi, bir tokenizer ve bir veya daha fazla token filtresi içerebilir.

Elasticsearch ile bir arama sorgusu oluşturmayı açıklayabilir misiniz?

Cevap: Elasticsearch'da, bir arama sorgusu genellikle HTTP GET isteği ile yapılan ve sorgu bilgilerini JSON biçiminde içeren bir istekle oluşturulur. Sorgu dilinde bir dizi farklı tip ve operatör vardır ve bu sorgular, belgeleri bulmak ve belgeler arasında filtrelemek için kullanılır.

Elasticsearch'da "aggregation" ne anlama gelir ve ne için kullanılır?

Cevap: Elasticsearch'da, "aggregation" belgeler üzerinde karmaşık istatistiksel analizler yapmayı sağlar. Bu, belgelerin bir dizi belirli ölçüt veya kıstaslarla gruplandırılmasını içerir. Aggregations, örneğin belge sayısı, ortalama, minimum, maksimum gibi belgelerin belirli alanları üzerinde çeşitli metrikler hesaplama işlemlerini içerir.

Elasticsearch'da bir "index" nedir?

Cevap: Elasticsearch'da, bir "index" belgeleri saklamak ve aramak için kullanılan bir birimdir. Bir index, belgelerin depolandığı ve arandığı yerdir. Indexler, genellikle belirli bir konu veya kategori etrafında düzenlenir.

Elasticsearch'da "_source" alanı ne anlama gelir?

Cevap: Elasticsearch'da, "_source" alanı, belgenin orijinal JSON gösterimini içerir. Bu, belge ilk olarak indekslendiğinde tam olarak nasıl göründüğünü belirtir. "_source" alanı, belgenin daha sonraki getirilmesi veya yeniden indekslenmesi için kullanılabilir.

Elasticsearch'da "bulk" işlemi ne anlama gelir?

Cevap: Elasticsearch'da, "bulk" işlemi, çok sayıda belgenin tek bir istekte indekslenmesini veya silinmesini sağlar. Bu, büyük veri setlerinin hızlı bir şekilde işlenmesi için kullanışlıdır ve daha iyi performans sağlar çünkü ağ üzerindeki yükü azaltır.

"Nested" ve "parent-child" ilişkileri arasındaki fark nedir?

Cevap: "Nested" ve "parent-child" ilişkileri, Elasticsearch'da karmaşık veri yapıları oluşturmanın iki yoludur. Nested ilişkilerde, bir belge içinde bir dizi diğer belgeler saklanabilir. Buna karşın, parent-child ilişkilerinde, bir belge başka bir belgeye bağlanabilir, ancak her iki belge de ayrı olarak saklanabilir. Nested ilişkiler genellikle daha hızlı sorgulara izin verirken, parent-child ilişkileri daha esnek veri modellemesine izin verir.

Elasticsearch'da "routing" ne anlama gelir?

Cevap: Elasticsearch'da, "routing" bir belgenin hangi shard'a gideceğini belirleyen bir süreçtir. Varsayılan olarak, bir belgenin hangi shard'a gideceği belgenin kimliği (ID) üzerinden belirlenir. Ancak, özel bir routing değeri belirtilebilir, bu sayede belgeler belirli bir shard'a yönlendirilebilir. Bu, performansı iyileştirebilir ve belirli durumlarda daha etkili sorgulara izin verir.

"Term" ve "Match" sorguları arasındaki fark nedir?

Cevap: Elasticsearch'da "term" ve "match" sorguları belirli bir kriteri karşılayan belgeleri bulmak için kullanılır, ancak farklı şekillerde çalışırlar. "Term" sorgusu, tam eşleşmeler arar ve büyük-küçük harf duyarlıdır. Diğer taraftan, "match" sorgusu, belge içinde belirli bir kelimenin veya ifadenin var olup olmadığını kontrol eder ve büyük-küçük harfe duyarlı değildir.

Elasticsearch'da "highlighting" özelliği nedir ve nasıl kullanılır?

Cevap: Elasticsearch'da "highlighting" özelliği, bir sorgunun sonuçlarından belirli bir parçayı vurgular. Bu genellikle, bir kullanıcının bir belge içindeki bir arama terimini bulmasına yardımcı olmak için kullanılır. "Highlighting" özelliği, bir sorguya bir "highlight" bölümü ekleyerek kullanılır.

Elasticsearch'da "alias" nedir ve nasıl kullanılır?

Cevap: Elasticsearch'da bir "alias", bir veya daha fazla indeks için bir yer tutucu olarak kullanılabilir. Alias'lar genellikle, bir uygulamanın hangi indeksle çalıştığını değiştirmek için kullanılır, böylece uygulama kodu değiştirilmeden indeks yapılandırması değiştirilebilir.

Elasticsearch'da "fuzzy" sorguları nedir ve ne için kullanılır?

Cevap: Elasticsearch'da, bir "fuzzy" sorgusu, bir belgenin bir sorguyla tam olarak eşleşmese bile, belirli bir tolerans seviyesi içinde nasıl eşleştiğini bulmak için kullanılır. Bu, örneğin, yazım hatalarını ve benzer kelimeleri bulmak için kullanışlıdır.

"Rolling index" kavramını açıklayabilir misiniz?

Cevap: "Rolling index" kavramı, esasen, yeni verileri saklamak için sürekli olarak yeni indeksler oluşturmayı içerir. Bu genellikle, veri miktarı çok büyük olduğunda ve eski verilerin arşivlenmesi veya silinmesi gerektiğinde kullanılır. Bu yaklaşım, veriyi daha yönetilebilir parçalara böler ve performansı iyileştirir.

Elasticsearch'da "mapping" ne anlama gelir?

Cevap: Elasticsearch'da, "mapping" bir indeksin içindeki belgelerin nasıl depolandığı ve indekslendiği ile ilgili kuralları belirler. "Mapping", bir indeksin alanlarının veri tiplerini belirler ve bu alanlara nasıl sorgu yapılacağını ve indeksleneceğini belirler.

Elasticsearch'da "shard" nedir ve ne için kullanılır?

Cevap: Elasticsearch'da bir "shard", bir indeksin bölünmüş veya parçalanmış bir parçasıdır. Sharding, bir indeksin birden fazla sunucu arasında dağıtılmasına olanak sağlar, bu da ölçeklenebilirlik ve hızlı veri işleme için kritiktir.

"Ingest node" ne anlama gelir ve ne için kullanılır?

Cevap: Elasticsearch'da, bir "ingest node" belgeleri kabul eder ve belgeler üzerinde önceden tanımlanmış bir dizi işlemi (örneğin, tarihlerin normalleştirilmesi veya metin verilerinin çıkarılması) gerçekleştirir. Bu işlemler belgenin Elasticsearch'e eklenmeden önce gerçekleştirilir.

Elasticsearch'da belgeleri güncellemenin birden fazla yolu olduğunu biliyor musunuz?

Cevap: Evet, Elasticsearch'da belgeleri güncellemek için birkaç yol vardır. Bir belgeyi tamamen yeni bir belgeyle değiştirebilirsiniz, bir belgeye yeni alanlar ekleyebilir veya var olan alanları değiştirebilirsiniz, veya bir belgenin mevcut değerlerini kullanarak belgeyi güncelleyebilirsiniz (örneğin, bir sayıyı artırabilirsiniz).

Elasticsearch'da "query DSL" nedir?

Cevap: Elasticsearch'da, "query DSL" (Domain Specific Language), sorguların ve filtrelerin yazılması için kullanılan bir dilidir. Query DSL, JSON kullanılarak ifade edilir ve Elasticsearch sorgularının, belirli bir belge seti üzerinde neler yapabileceğini belirlemek için çok geniş bir özellik yelpazesi sunar.

Elasticsearch'da "analyzer" nedir?

Cevap: Elasticsearch'da, bir "analyzer" metni belirli bir şekilde işlemek için kullanılan bir bileşendir. Bir analyzer, genellikle bir "tokenizer" ve bir veya daha fazla "token filter" içerir. Tokenizer, metni belirli bir şekilde böler (örneğin, boşluklara göre), ve token filtreleri, tokenleri belirli bir şekilde değiştirir (örneğin, tüm harfleri küçültme).

"Aggregations" Elasticsearch'da ne anlama gelir?

Cevap: Elasticsearch'da, "aggregations" bir belge setinin belirli bir özelliğine göre belgeleri gruplamak için kullanılır. Örneğin, bir grup belgedeki en yüksek veya en düşük değeri bulmak için bir aggregation kullanabilirsiniz. Aggregations, büyük veri setlerinden bilgi çıkarmak için son derece yararlıdır.

"Relevance score" nedir ve nasıl hesaplanır?

Cevap: Elasticsearch'da, bir "relevance score" bir belgenin bir sorguyla ne kadar iyi eşleştiğini belirler. Relevance score, bir dizi faktöre dayanır, bunlar arasında belgenin içindeki arama terimlerinin sıklığı, belgenin uzunluğu ve indeksteki diğer belgelerde arama terimlerinin ne kadar yaygın olduğu bulunur.

Elasticsearch'ta "replica shards" ne işe yarar?

Cevap: Elasticsearch'ta, bir "replica shard" bir "primary shard"ın kopyasıdır ve yüksek kullanılabilirlik ve hızlı okuma hızları sağlar. Replica shard'lar ayrıca, bir primary shard'ın başarısız olması durumunda bir yedeklik sağlar.

Elasticsearch'da bir belgeyi nasıl sileriz?

Cevap: Elasticsearch'da, bir belgeyi silmek için DELETE HTTP isteğini kullanabiliriz. Bu isteği, belgenin bulunduğu indeksin ve belgenin kimliğinin (ID) adını belirten bir URL'ye göndeririz.

Elasticsearch'ta analiz sürecini özelleştirmek için hangi

özellikleri kullanabiliriz?

Cevap: Elasticsearch'ta analiz sürecini özelleştirmek için "custom analyzer" (özel analizör), "token filter" (token filtresi), "char filter" (karakter filtresi) gibi özellikleri kullanabiliriz. Bu özellikler sayesinde metin analizini özelleştirebilir ve metinleri indekslerken veya sorgularken istediğimiz şekilde işleyebiliriz.

Elasticsearch'ta "aggregation pipeline" (birleştirme boru

hattı) nedir?

Cevap: Elasticsearch'ta "aggregation pipeline" (birleştirme boru hattı), birden fazla aggregation'ı bir araya getirerek daha karmaşık analiz işlemleri yapmamızı sağlar. Bu, bir aggregation sonucunu başka bir aggregation'a girdi olarak kullanma veya birden fazla düzeyde gruplama yapma gibi işlemleri gerçekleştirebilmemizi sağlar.

Elasticsearch'ta "bulk indexing" nedir ve nasıl kullanılır?

Cevap: Elasticsearch'ta "bulk indexing", bir istekte birden fazla belgeyi indekslemek için kullanılan bir yöntemdir. Bu yöntem, belgeleri JSON formatında bir dizi halinde göndererek verimli bir şekilde çok sayıda belgeyi indekslememizi sağlar. Bulk indexing, veri yüklerini daha hızlı ve etkin bir şekilde işlemek için yaygın olarak kullanılır.

Elasticsearch'ta "filter" ve "query" sorguları arasındaki fark

nedir?

Cevap: Elasticsearch'ta "filter" sorguları, belirli bir kriteri karşılayan belgeleri döndürürken, "query" sorguları, belgeleri belirli bir kriterle eşleşme oranına göre sıralar. Filter sorguları skorlama yapmadığı için daha hızlıdır ve özellikle eşleşen belgeleri filtrelemek için kullanılırken, query sorguları daha karmaşık sorgulama senaryoları için tercih edilir.

Elasticsearch'ta "search context" (arama bağlamı) nedir?

Cevap: Elasticsearch'ta "search context", bir sorgunun veya bir dizi sorgunun çalıştığı mantıksal alanı ifade eder. Arama bağlamı, sorgunun geçerli filtreleri, sıralama kriterlerini ve diğer parametreleri içerir. Bir sorgu, bir search context içinde çalıştırılır ve sonuçlar bu context'e göre döndürülür.

Elasticsearch interview soruları ve cevapları

Single sign on sso nedir? JWT ile SSO. SSO SSS ve Cevapları

3- Domain-Driven Design ve Hexagonal(Altıgen) Mimari - Petter Holmström - Çevirsi

Categories

Main Tags

Translate

Latest Posts

Popular Posts

Single sign on sso nedir? JWT ile SSO. SSO SSS ve Cevapları

Nisan 2026 da iş bulmak isteyen yeni mezun bir bilgisayar/yazılım mühendisi için çok şey öğrenme baskısını nasıl bertaraf edebilir?

İşte 100 adımda Spring Boot öğrenmek ve uygulama geliştirmek için temel adımları içeren bir rehber:

نموذج الاتصال