শিক্ষানবিশদের জন্য এইচআইভি টিউটোরিয়াল | মজাদার আর্কিটেকচার | নাসার কেস স্টাডি

অ্যাপাচি হাইভ টিউটোরিয়াল: ভূমিকা

মুরগি হ'ল বিগ ডেটা অ্যানালিটিক্সের জন্য কঠোরভাবে শিল্প-ব্যাপী ব্যবহৃত সরঞ্জাম এবং আপনার শুরু করার জন্য দুর্দান্ত সরঞ্জাম সঙ্গে. এই হাইভ টিউটোরিয়াল ব্লগে, আমরা গভীরভাবে অ্যাপাচি হাইভের বিষয়ে আলোচনা করব। অ্যাপাচি এইচআইভি একটি ডেটা গুদামজাতকরণ সরঞ্জাম is যা বিগ ডেটা অনুসন্ধান এবং বিশ্লেষণের জন্য ভাষার মতো এসকিউএল সরবরাহ করে। হাইভের বিকাশের পেছনে অনুপ্রেরণা হ'ল এসকিউএল বিকাশকারী ও বিশ্লেষকদের জন্য ঘর্ষণ-কম শেখার পথ। মুরগির বাচ্চারা কেবল অ-প্রোগ্রামিং ব্যাকগ্রাউন্ডের লোকদেরই ত্রাণকর্তা নয়, তবে এটি এমন প্রোগ্রামারদের কাজকেও হ্রাস করে যা ম্যাপ্রেডস প্রোগ্রাম লেখার জন্য দীর্ঘ সময় ব্যয় করে। এই অ্যাপাচি হাইভ টিউটোরিয়াল ব্লগে, আমি এই বিষয়ে কথা বলব:

মধু কি?
অ্যাপাচি হাইভের গল্প - ফেসবুক থেকে অ্যাপাচি পর্যন্ত
অ্যাপাচি হাইভের সুবিধা
অ্যাপাচি হাইভ - নাসার কেস স্টাডি
অ্যাপাচি হাইভ আর্কিটেকচার
মেটাস্টোর কনফিগারেশন
মুরগির ডেটা মডেল

অ্যাপাচি হাইভ টিউটোরিয়াল: মধু কি?

অ্যাপাচি হাইভ হাদোপের শীর্ষে নির্মিত একটি ডেটা গুদাম সিস্টেম এবং কাঠামোগত এবং আধা-কাঠামোগত ডেটা বিশ্লেষণের জন্য ব্যবহৃত হয়।মধুযাত্রী হ্যাডোপ ম্যাপ্রেডুসের জটিলতা বিমূর্ত করে। মূলত, এটি ডেটাতে কাঠামো প্রজেক্ট করার জন্য এবং এইচকিউএল (হাইভ কোয়েরি ল্যাঙ্গুয়েজ) লিখিত ক্যোয়ারীগুলি সম্পাদন করে যা এসকিউএল স্টেটমেন্টগুলির অনুরূপ। অভ্যন্তরীণভাবে, এই প্রশ্নগুলি বা এইচকিউএল হিভ সংকলক দ্বারা কাজের হ্রাস মানচিত্রে রূপান্তরিত হয়। অতএব, হ্যাডোপ ব্যবহার করে আপনার ডেটা প্রক্রিয়া করার জন্য জটিল মানচিত্রে প্রোগ্রাম লেখার বিষয়ে আপনার চিন্তা করার দরকার নেই। এটি এসকিউএল সহ স্বাচ্ছন্দ্যযুক্ত ব্যবহারকারীদের দিকে লক্ষ্যযুক্ত। অ্যাপাচি হাইভ ডেটা সংজ্ঞা ভাষা (ডিডিএল), ডেটা ম্যানিপুলেশন ল্যাঙ্গুয়েজ (ডিএমএল) এবং ব্যবহারকারীর সংজ্ঞায়িত ফাংশন (ইউডিএফ) সমর্থন করে।

শিক্ষানবিশদের জন্য এইচআইভি টিউটোরিয়াল | গভীরতার মধ্যে মধুচোষা বোঝা | এডুরেকা

এসকিউএল + হ্যাডোপ ম্যাপ্রেডস = হাইভকিউএল

অ্যাপাচি হাইভ টিউটোরিয়াল: মাতাল গল্প - ফেসবুক থেকে আপাচে to

ফেসবুক ইউজ কেস - হাইভ টিউটোরিয়াল - এডুরেকা ডুমুর : হাইভ টিউটোরিয়াল - ফেসবুক ব্যবহারের ক্ষেত্রে

ফেসবুকে চ্যালেঞ্জগুলি: ডেটাগুলির তাত্পর্যপূর্ণ বৃদ্ধি

২০০৮ এর আগে ফেসবুকের সমস্ত ডেটা প্রসেসিং অবকাঠামো বাণিজ্যিক আরডিবিএমএসের উপর ভিত্তি করে একটি ডেটা গুদামের চারপাশে নির্মিত হয়েছিল। এই অবকাঠামোগুলি সেই সময় ফেসবুকের প্রয়োজনীয়তা যথেষ্ট করতে সক্ষম ছিল। কিন্তু, ডেটা খুব দ্রুত বাড়তে শুরু করার সাথে সাথে এই বিশাল ডেটাसेटটি পরিচালনা ও প্রক্রিয়াজাতকরণ একটি বিশাল চ্যালেঞ্জ হয়ে দাঁড়িয়েছে। একটি ফেসবুক নিবন্ধ অনুসারে, 2007-এর 15 টিবি ডেটা সেট করা ডেটা থেকে ২০০৯-এর 2 পিবি ডেটা পর্যন্ত তথ্য পরিমাপ করা হয়েছিল। এছাড়াও, অনেক ফেসবুক পণ্য শ্রোতাদের অন্তর্দৃষ্টি, ফেসবুক লিক্সিকন, ফেসবুক বিজ্ঞাপন ইত্যাদির মতো ডেটা বিশ্লেষণের সাথে জড়িত So এই খুব সমস্যা মোকাবেলা করার জন্য একটি স্কেলযোগ্য এবং অর্থনৈতিক সমাধানের প্রয়োজন এবং তাই হাদুপ কাঠামোটি ব্যবহার শুরু করে।

গণতান্ত্রিকীকরণ হ্যাডোপ - মানচিত্রের

কিন্তু, ডেটা বাড়ার সাথে সাথে মানচিত্র-হ্রাস কোডগুলির জটিলতা আনুপাতিকভাবে বৃদ্ধি পেয়েছে। সুতরাং, অ-প্রোগ্রামিং ব্যাকগ্রাউন্ডযুক্ত লোকদের ম্যাপ্রেডস প্রোগ্রাম লিখতে প্রশিক্ষণ দেওয়া কঠিন হয়ে পড়েছিল। এছাড়াও, সাধারণ বিশ্লেষণ সম্পাদনের জন্য একজনকে মানচিত্রে কোডের একশ লাইন লিখতে হবে। যেহেতু, এসকিউএল ফেসবুক সহ ইঞ্জিনিয়ার এবং বিশ্লেষকরা ব্যাপকভাবে ব্যবহার করেছিলেন, সুতরাং, হ্যাডোপের শীর্ষে এসকিউএল স্থাপন করা হ্যাডোপকে এসকিউএল ব্যাকগ্রাউন্ডের ব্যবহারকারীদের কাছে অ্যাক্সেসযোগ্য করার একটি যৌক্তিক উপায় বলে মনে হয়েছিল।

সুতরাং, বিশ্লেষণাত্মক প্রয়োজনীয়তার বেশিরভাগের জন্য এসকিউএল-এর ক্ষমতা এবং হ্যাডোপের স্কেলিবিলিটি জন্ম দিয়েছে অ্যাপাচি হিভ যা এইচডিএফএসে উপস্থিত ডেটাতে এসকিউএল যেমন কোয়েরি করতে পারে। পরে, এই হাইভ প্রকল্পটি ফেসবুকের মাধ্যমে আগস্ট ২০০৮-এ উন্মুক্ত হয়েছিল এবং আজ আপাচি হাইভ হিসাবে অবাধে উপলব্ধ।

এখন আসুন আমরা এইচআইভির বৈশিষ্ট্য বা সুবিধাগুলি সন্ধান করি যা এটিকে এত জনপ্রিয় করে তুলেছে।

অ্যাপাচি হাইভ টিউটোরিয়াল: মাইনের সুবিধা

যেসব প্রোগ্রামিং ব্যাকগ্রাউন্ড থেকে নেই তাদের পক্ষে দরকারী কারণ এটি জটিল মানচিত্রের প্রোগ্রাম লেখার প্রয়োজনীয়তা হ্রাস করে।
এক্সটেনসিবল এবং স্কেলেবল সিস্টেমের কার্যকারিতা প্রভাবিত না করে, ক্রমবর্ধমান পরিমাণ এবং বিভিন্ন ডেটা সহ্য করার জন্য।
এটি একটি দক্ষ ETL (এক্সট্র্যাক্ট, ট্রান্সফর্ম, লোড) সরঞ্জাম হিসাবে।
হাইভ জাভা, পিএইচপি, পাইথন, সি ++ বা রুবিতে লিখিত যে কোনও ক্লায়েন্ট অ্যাপ্লিকেশনটিকে তা প্রকাশ করে সমর্থন করে থ্রিফ্ট সার্ভার । (আপনি এই ক্লায়েন্টটি ব্যবহার করতে পারেন - এসকিউএল এম্বেড করা পাশের ভাষা যেমন ডিবি 2 ইত্যাদির ডেটাবেস অ্যাক্সেসের জন্য)।
যেহেতু হাইভের মেটাডেটা তথ্য একটি আরডিবিএমএসে সঞ্চিত রয়েছে, এটি ক্যোয়ারি এক্সিকিউশন চলাকালীন শব্দার্থ পরীক্ষা করে নেওয়ার সময়কে উল্লেখযোগ্যভাবে হ্রাস করে।

অ্যাপাচি হাইভ টিউটোরিয়াল: অ্যাপাচি হুভ কোথায় ব্যবহার করবেন?

অ্যাপাচি হাইভ উভয় জগতের অর্থাত্ এসকিউএল ডেটাবেস সিস্টেম এবং কাঠামো অতএব, এটি সংস্থাগুলির বিশাল জনতা ব্যবহার করে by এটি বেশিরভাগ ডেটা গুদামজাতকরণের জন্য ব্যবহৃত হয় যেখানে আপনি বিশ্লেষণ এবং ডেটা মাইনিং সম্পাদন করতে পারেন যার জন্য রিয়েল টাইম প্রসেসিংয়ের প্রয়োজন হয় না। কয়েকটি ক্ষেত্র যেখানে আপনি অ্যাপাচি হাইভ ব্যবহার করতে পারেন সেগুলি নিম্নরূপ:

তথ্য গুদাম
অ্যাড-হক বিশ্লেষণ

যেমনটি বলা হয়ে থাকে, আপনি কেবল এক হাতে তালি দিতে পারবেন না। আপনি একক সরঞ্জাম দিয়ে প্রতিটি সমস্যা সমাধান করতে পারবেন না। অতএব, আপনি অন্যান্য অনেকগুলি ডোমেনে এটি ব্যবহারের জন্য অন্যান্য সরঞ্জামগুলির সাথে হুইপকে দম্পতি করতে পারেন। উদাহরণস্বরূপ, অ্যাপাচি হাইভের সাথে টেবিলের ঝকঝকে ডেটা ভিজ্যুয়ালাইজেশনের জন্য ব্যবহার করা যেতে পারে, হাইভের সাথে অ্যাপাচি তেজ সংহতকরণ আপনাকে রিয়েল টাইম প্রসেসিং ক্ষমতা ইত্যাদি সরবরাহ করবে etc.
এই অ্যাপাচি হাইভ টিউটোরিয়াল ব্লগে এগিয়ে চলুন, আসুন আমরা নাসার একটি কেস স্টাডি ঘুরে দেখি যেখানে আপনি জলবায়ু মডেলগুলির মূল্যায়ন করার সময় নাসার বিজ্ঞানীরা যে সমস্যার মুখোমুখি হয়েছিল যে কীভাবে হিভ সমস্যার সমাধান করেছিলেন তা জানতে পারবেন।

Hive টিউটোরিয়াল: নাসার কেস স্টাডি

একটি জলবায়ু মডেল পৃথিবীর জলবায়ুকে প্রভাবিত করে এমন বিভিন্ন কারণের উপর ভিত্তি করে জলবায়ু ব্যবস্থার গাণিতিক উপস্থাপনা। মূলত, এটি জলবায়ুর বিভিন্ন চালকের যেমন সমুদ্র, সূর্য, বায়ুমণ্ডল ইত্যাদির মিথস্ক্রিয়াকে বর্ণনা করেজলবায়ু ব্যবস্থার গতিশীলতা সম্পর্কে অন্তর্দৃষ্টি সরবরাহ করুন। এটি জলবায়ু প্রভাবিত করে এমন উপাদানগুলির উপর ভিত্তি করে জলবায়ু পরিবর্তনের অনুকরণ করে জলবায়ু পরিস্থিতি প্রজেক্ট করতে ব্যবহৃত হয়। নাসার জেট প্রোপালশন ল্যাবরেটরি বিভিন্ন বাহ্যিক ভাণ্ডারে উপস্থিত রিমোট সেন্সিং ডেটার বিপরীতে জলবায়ু আউটপুট মডেল বিশ্লেষণ ও মূল্যায়নের জন্য আঞ্চলিক জলবায়ু মডেল মূল্যায়ন সিস্টেম (আরসিএমইএস) তৈরি করেছে।

আরসিএমইএস (আঞ্চলিক জলবায়ু মডেল মূল্যায়ন সিস্টেম) এর দুটি উপাদান রয়েছে:

আরসিএমইডি (আঞ্চলিক জলবায়ু মডেল মূল্যায়ন ডাটাবেস):

এটি একটি স্কেলযোগ্য ক্লাউড ডাটাবেস যা অ্যাপাচি ওওডিটি এক্সট্র্যাক্টর, অ্যাপাচি টিকা ইত্যাদির মতো এক্সট্র্যাক্টর ব্যবহার করে জলবায়ুর সাথে সম্পর্কিত রিমোট সেন্সিং ডেটা এবং পুনরায় বিশ্লেষণের ডেটা লোড করে, পরিশেষে, এটি ডেটা পয়েন্ট মডেল হিসাবে রূপান্তর করে যা রূপটির (অক্ষাংশ) , দ্রাঘিমাংশ, সময়, মান, উচ্চতা) এবং এটিকে আমার এসকিউএল ডাটাবেসে সঞ্চয় করে। ক্লায়েন্ট স্থান / সময় অনুসন্ধান সম্পাদন করে আরসিএমইডে উপস্থিত ডেটা পুনরুদ্ধার করতে পারে। এই জাতীয় প্রশ্নের বিবরণ এখন আমাদের জন্য প্রাসঙ্গিক নয়।

আরসিএমইটি (আঞ্চলিক জলবায়ু মডেল মূল্যায়ন টুলকিট):

এটি ব্যবহারকারীকে বিভিন্ন ধরণের বিশ্লেষণ এবং মূল্যায়ন করার জন্য কিছু অন্যান্য উত্স থেকে প্রাপ্ত জলবায়ু মডেল আউটপুট ডেটার সাথে আরসিএমইডে উপস্থিত রেফারেন্স ডেটার সাথে তুলনা করার ক্ষমতা সরবরাহ করে। আরসিএমইএসের আর্কিটেকচারটি বুঝতে আপনি নীচে দেওয়া চিত্রটি উল্লেখ করতে পারেন।

জলবায়ু মডেল মূল্যায়নের জন্য প্রয়োজনীয় বিভিন্ন পরামিতি অনুসারে আরসিএমইডে রেফারেন্স ডেটা উপগ্রহ-ভিত্তিক রিমোট সেন্সিং থেকে আসে। উদাহরণস্বরূপ - এআইআরএস (বায়ুমণ্ডলীয় ইনফ্রারেড সাউন্ডার) পৃষ্ঠের বায়ু তাপমাত্রা, তাপমাত্রা এবং ভূ-জোটের মতো পরামিতি সরবরাহ করে, টিআরএমএম (ক্রান্তীয় বৃষ্টিপাত পরিমাপ মিশন) মাসিক বৃষ্টিপাত ইত্যাদি সরবরাহ করে

পোজো ভিত্তিক প্রোগ্রামিং মডেল কী

মাইএসকিউএল ডেটাবেস সিস্টেম ব্যবহার করে নাসা দ্বারা সমস্যাগুলি:

মাইএসকিউএল ডাটাবেসটি ফর্মের 6 বিলিয়ন টিপলস (অক্ষাংশ, দ্রাঘিমাংশ, সময়, ডেটা পয়েন্ট মান, উচ্চতা) দিয়ে লোড করার পরে, উপরের চিত্রটিতে প্রদর্শিত সিস্টেমটি ক্র্যাশ হয়ে গেছে।
এমনকি পুরো টেবিলটিকে ছোট ছোট উপগ্রহে বিভক্ত করার পরেও ডেটা প্রক্রিয়া করার সময় সিস্টেমটি বিশাল ওভারহেড উত্পন্ন করেছিল।

সুতরাং, তাদের একটি স্কেলযোগ্য সমাধান দরকার যা এসকিউএল-এর সাথে এই বিশাল পরিমাণের ডেটা সঞ্চয় এবং প্রসেসের মতো সক্ষমতা অনুসন্ধানের মতো করতে পারে। অবশেষে, তারা উপরে বর্ণিত সমস্যাগুলি কাটিয়ে উঠতে অ্যাপাচি হাইভ ব্যবহার করার সিদ্ধান্ত নিয়েছে।

কিভাবে অ্যাপাচি হাইভ সমস্যা সমাধান করতে পারে?

এখন দেখা যাক, সেই বৈশিষ্ট্যগুলি কী কী যা নাসার জেপিএল দলকে তাদের সমাধানের কৌশলটিতে অবিচ্ছেদ্য অংশ হিসাবে অ্যাপাচি হিভকে অন্তর্ভুক্ত করতে রাজি করেছিল:

যেহেতু, অ্যাপাচি হাইভ হ্যাডোপের শীর্ষে চলেছে, এটি স্কেলযোগ্য এবং বিতরণ এবং সমান্তরাল ফ্যাশনে ডেটা প্রক্রিয়া করতে পারে।
এটি হাইভ ক্যোয়ারী ল্যাঙ্গুয়েজ সরবরাহ করে যা এসকিউএল এর অনুরূপ এবং তাই শেখা সহজ।

মৌচাকের মোতায়েন:

নীচের চিত্রটি অ্যাপাচি হাইভ ইন্টিগ্রেশন সহ আরসিএমইএস আর্কিটেক্টকে ব্যাখ্যা করে:

ডুমুর : হাইভ টিউটোরিয়াল - আপাচি হুভের সাথে আরসিএমইএস আর্কিটেকচার

উপরের চিত্রটি আরসিএমইএসে অ্যাপাচি পোষাকের স্থাপনাকে দেখায়। অ্যাপাচি হাইভকে মোতায়েন করার সময় নাসা দলটি নিম্নলিখিত পদক্ষেপ গ্রহণ করেছিল:

উপরের চিত্রটিতে প্রদর্শিত হিসাবে তারা ক্লৌডেরা এবং অ্যাপাচি হাদুপ ব্যবহার করে হিভ ইনস্টল করেছেন।
তারা মাইএসকিউএল ডেটাবেস থেকে হাইভের ডেটা প্রবেশের জন্য অ্যাপাচি স্কুওপ ব্যবহার করেছিল।
হাইভের উপর প্রশ্নগুলি সম্পাদন করতে এবং আরসিএমইটিতে ডেটা পুনরুদ্ধার করতে অ্যাপাচি ওওডিটি মোড়ক কার্যকর করা হয়েছিল।

হাইভের সাথে প্রাথমিক বেঞ্চমার্কিং পর্যবেক্ষণ:

প্রাথমিকভাবে তারা একটি একক টেবিলের মধ্যে 2.5 বিলিয়ন ডেটা পয়েন্ট লোড করেছে এবং একটি গণনা কোয়েরি করেছে। উদাহরণ স্বরূপ, মধু> ডেটাপয়েন্টপয়েন্ট থেকে গণনা (ডেটাপয়েন্ট_আইডি) নির্বাচন করুন। সমস্ত রেকর্ড গণনা করতে 5-6 মিনিট সময় লেগেছিল (সম্পূর্ণ 6.8 বিলিয়ন রেকর্ডের জন্য 15-17 মিনিট)।
হ্রাস পর্বটি দ্রুত ছিল, তবে মানচিত্রের পর্বে মোট প্রক্রিয়াজাতকরণের 95% সময় নিয়েছিল। তারা ছয়টি ব্যবহার করছিল ( 4x কোয়াড-কোর ) সিস্টেম সহ 24 জিবি র‌্যাম (প্রায়।) সিস্টেমে প্রতিটি।
এমনকি আরও মেশিন যুক্ত করার পরেও, এইচডিএফএস ব্লকের আকার পরিবর্তন করে (MB৪ এমবি, ১২৮ এমবি, ২৫6 এমবি) এবং অন্যান্য অনেক কনফিগারেশন ভেরিয়েবল পরিবর্তন করে (io।সাজান।ফ্যাক্টর, i।সাজান।এমবি), তারা গণনা শেষ করার সময় হ্রাস করতে খুব বেশি সাফল্য পাননি।

মাতাল সম্প্রদায়ের সদস্যদের ইনপুট:

অবশেষে, হাইভ সম্প্রদায়ের সদস্যরা উদ্ধার করতে এসে তাদের বর্তমান মাতাল বাস্তবায়নের মাধ্যমে সমস্যাগুলি সমাধান করার জন্য বিভিন্ন অন্তর্দৃষ্টি প্রদান করেছেন:

তারা উল্লেখ করেছে যে এইচডিএফএস পড়ার গতি আনুমানিক 60 এমবি / এস তুলনামুলকভাবে 1 জিবি / এস লোকাল ডিস্কের ক্ষেত্রে, নেমনোডের নেটওয়ার্ক ক্ষমতা এবং কাজের চাপের উপর নির্ভর করে।
সদস্যরা পরামর্শ দিয়েছেন যে 16 ম্যাপার স্থানীয় নন-হাডুপ কাজের সাথে আই / ও পারফরম্যান্সের সাথে মেলে তাদের বর্তমান সিস্টেমে প্রয়োজনীয় হবে।
তারা কমিয়ে দেওয়ার পরামর্শও দিয়েছিল বিভক্ত আকার প্রতিটি ম্যাপারের জন্য সংখ্যা বাড়ানোর জন্যএরম্যাপার এবং তাই আরও সমান্তরালতা সরবরাহ করে।
অবশেষে, সম্প্রদায়ের সদস্যরা তাদের তাদের জানিয়েছিল ব্যবহার গণনা (1) পরিবর্তে উল্লেখ করা গণনা ( ডেটাপয়েন্ট_আইডি) । এটি কারণ কারণ (1) গণনার ক্ষেত্রে, কোনও রেফারেন্স কলাম নেই এবং সুতরাং, গণনা সম্পাদন করার সময় কোনও সংক্ষেপণ এবং deserialization হয় না।

অবশেষে, নাসা এইচআইভি সম্প্রদায়ের সদস্যদের দেওয়া সমস্ত পরামর্শ বিবেচনায় নিয়ে তাদের প্রত্যাশা অনুযায়ী তাদের এইচআইভি ক্লাস্টারটি সুর করতে সক্ষম হয়েছিল। এবং তাই, তারা উপরে উল্লিখিত সিস্টেম কনফিগারেশনগুলি ব্যবহার করে মাত্র 15 সেকেন্ডের মধ্যে কয়েক বিলিয়ন সারি জিজ্ঞাসা করতে সক্ষম হয়েছিল।

অ্যাপাচি হাইভ টিউটোরিয়াল: হাইভ আর্কিটেকচার এবং এর উপাদানগুলি

নীচের চিত্রটি হাইভ আর্কিটেকচার এবং যে প্রবাহে একটি কোয়েরি জমা দেওয়া হয়েছে তা বর্ণনা করেমধুএবং অবশেষে মানচিত্রের ফ্রেমওয়ার্ক ব্যবহার করে প্রক্রিয়া করা হয়েছে:

ডুমুর : হাইভ টিউটোরিয়াল - হাইভ আর্কিটেকচার

উপরের চিত্রটিতে প্রদর্শিত হিসাবে, মধুচীতির আর্কিটেকচারটি নিম্নলিখিত উপাদানগুলিতে শ্রেণিবদ্ধ করা যেতে পারে:

মধুচক্র ক্লায়েন্ট: জেভিডিসি, থ্রিফট এবং ওডিবিসি ড্রাইভার ব্যবহার করে জাভা, সি ++, পাইথন ইত্যাদি অনেক ভাষায় লিখিত অ্যাপ্লিকেশনকে হুভ সমর্থন করে। সুতরাং কেউ সর্বদা তাদের পছন্দের একটি ভাষায় লিখিত মুরগির ক্লায়েন্ট অ্যাপ্লিকেশন লিখতে পারেন।
মাতাল পরিষেবা: অ্যাপাচি হাইভ সিআরএলআই, ওয়েব ইন্টারফেস ইত্যাদির জন্য বিভিন্ন কোয়েরি করার জন্য বিভিন্ন পরিষেবা সরবরাহ করে। এই হাইভ টিউটোরিয়াল ব্লগে আমরা তাদের প্রত্যেককে শীঘ্রই অন্বেষণ করব।
প্রসেসিং ফ্রেমওয়ার্ক এবং রিসোর্স ম্যানেজমেন্ট: অভ্যন্তরীণভাবে,এইচআইভি কোয়েরিগুলি সম্পাদন করতে হ্যাডোপ ম্যাপ্রেইডস ফ্রেমওয়ার্কটি ডি প্রকো ইঞ্জিন হিসাবে ব্যবহার করে। এটি নিজের মধ্যে একটি পৃথক বিষয় এবং তাই এখানে আলোচনা হয় না।
বিতরণ স্টোরেজ: যেহেতু হুডো হ্যাডুপের উপরে ইনস্টল করা আছে, এটি বিতরণকৃত স্টোরেজের জন্য অন্তর্নিহিত এইচডিএফএস ব্যবহার করে। আপনি উল্লেখ করতে পারেন এইচডিএফএস ব্লগ এটি সম্পর্কে আরও জানতে।

এখন, আসুন হিভ আর্কিটেকচারের প্রথম দুটি প্রধান উপাদানগুলি ঘুরে দেখি:

মধুচক্র ক্লায়েন্ট:

মাতালকে অনুসন্ধান করার জন্য অ্যাপাচি হাইভ বিভিন্ন ধরণের ক্লায়েন্ট অ্যাপ্লিকেশন সমর্থন করে। এই ক্লায়েন্টদের তিন ধরণের মধ্যে শ্রেণীবদ্ধ করা যেতে পারে:

থ্রিফ্ট ক্লায়েন্ট: যেহেতু হাইভ সার্ভারটি অ্যাপাচি থ্রিফ্টের উপর ভিত্তি করে, এটি থ্রিফ্ট সমর্থন করে এমন সমস্ত প্রোগ্রামিং ভাষা থেকে অনুরোধটি সরবরাহ করতে পারে।
জেডিবিসি ক্লায়েন্ট: হাইভ জাভা অ্যাপ্লিকেশনগুলিকে জেডিবিসি ড্রাইভার ব্যবহার করে এটির সাথে সংযোগ স্থাপনের অনুমতি দেয় যা শ্রেণি সংস্থায় সংজ্ঞায়িত করা হয়।আপাচে।hadoop।hive.jdbc।HiveDriver।
ওডিবিসি ক্লায়েন্ট: হাইভ ওডিবিসি ড্রাইভার ওডিবিসি প্রোটোকল সমর্থনকারী অ্যাপ্লিকেশনগুলিকে হাইভের সাথে সংযোগ স্থাপনের অনুমতি দেয়। (জেডিবিসি ড্রাইভারের মতো, ওডিবিসি ড্রাইভার হাইভ সার্ভারের সাথে যোগাযোগের জন্য থ্রিফ্ট ব্যবহার করে))

২. মধুচক্রের পরিষেবাগুলি:

উপরের চিত্রে যেমন দেখানো হয়েছে তেমনই হুইভ অনেকগুলি পরিষেবা সরবরাহ করে। আসুন আমরা তাদের প্রত্যেককে এক নজরে দেখি:

হাইভ সিএলআই (কমান্ড লাইন ইন্টারফেস): এটি হাইভের সরবরাহ করা ডিফল্ট শেল যেখানে আপনি সরাসরি আপনার এইচইভি কোয়েরি এবং আদেশগুলি কার্যকর করতে পারেন।
অ্যাপাচি হাইভ ওয়েব ইন্টারফেস: কমান্ড লাইন ইন্টারফেস ছাড়াও, এইচআইভি হাইভ কোয়েরি এবং কমান্ড কার্যকর করার জন্য একটি ওয়েব ভিত্তিক জিইউআই সরবরাহ করে।
মধুচক্র সার্ভার: হাইভ সার্ভারটি অ্যাপাচি থ্রাইফ্টে নির্মিত এবং তাই থ্রাইফ্ট সার্ভার হিসাবেও পরিচিত যা বিভিন্ন ক্লায়েন্টকে হাইভের কাছে অনুরোধ জমা দিতে এবং চূড়ান্ত ফলাফল পুনরুদ্ধার করতে দেয়।
অ্যাপাচি হাইভ ড্রাইভার: এটি ক্লায়েন্টের সিএলআই, ওয়েব ইউআই, থ্রিফ্ট, ওডিবিসি বা জেডিবিসি ইন্টারফেসের মাধ্যমে জমা দেওয়া প্রশ্নগুলি পাওয়ার জন্য দায়বদ্ধ। তারপরে, ড্রাইভারটি ক্লায়ারের সংকলনটি পাস করে যেখানে মেটাস্টোরে উপস্থিত স্কিমার সাহায্যে পার্সিং, টাইপ চেকিং এবং শব্দার্থ বিশ্লেষণ ঘটে where। পরবর্তী পদক্ষেপে, মানচিত্র-হ্রাস কার্য এবং এইচডিএফএস কার্যগুলির একটি ডিএজি (নির্দেশিত অ্যাসাইক্লিক গ্রাফ) আকারে একটি অনুকূলিত যৌক্তিক পরিকল্পনা তৈরি করা হয়। অবশেষে, এক্সিকিউশন ইঞ্জিন হ্যাডোপ ব্যবহার করে তাদের নির্ভরতা অনুসারে এই কাজগুলি সম্পাদন করে।
মেটাস্টোর: আপনি ভাবতে পারেন মেটাস্টোরসমস্ত হাইভ মেটাডেটা তথ্য সঞ্চয় করার জন্য কেন্দ্রীয় ভান্ডার হিসাবে। মৌচাকের মেটাডেটাতে বিভিন্ন ধরণের তথ্য রয়েছে যেমন টেবিলের কাঠামো এবং পার্টিশনগুলিকলাম, কলামের ধরণ, সিরিয়ালাইজার এবং ডিসরিয়ালাইজারের সাথে যা এইচডিএফএসে উপস্থিত তথ্যগুলিতে পঠন / লেখার ক্রিয়াকলাপের জন্য প্রয়োজনীয়। মেটাস্টোরদুটি মৌলিক ইউনিট নিয়ে গঠিত:
- একটি পরিষেবা যা মেটাস্টোর সরবরাহ করেoth অ্যাক্সেসrমুরগি পরিষেবা।
- মেটাডেটার জন্য ডিস্ক স্টোরেজ যা এইচডিএফএস স্টোরেজ থেকে পৃথক।

এখন, আসুন আমরা হাইভ মেটাস্টোর প্রয়োগের বিভিন্ন উপায়গুলি বুঝতে পারিএই Hive টিউটোরিয়াল এর পরবর্তী বিভাগে।

অ্যাপাচি হাইভ টিউটোরিয়াল: মেটাস্টোর কনফিগারেশন

মেটাস্টোর আরডিবিএমএস এবং ডেটা নিউক্লিয়াস নামে একটি ওপেন সোর্স ওআরএম (অবজেক্ট রিলেশনাল মডেল) স্তর ব্যবহার করে মেটা ডেটা তথ্য সঞ্চয় করে যা বস্তুর উপস্থাপনাটিকে সম্পর্কিত স্কিমায় রূপান্তরিত করে এবং বিপরীতে। এইচডিএফএসের পরিবর্তে আরডিবিএমএস বাছাই করার কারণটি হ'ল কম বিলম্বিতা অর্জন করা। নিম্নলিখিত তিনটি কনফিগারেশনে আমরা মেটাস্টোর প্রয়োগ করতে পারি:

1. এম্বেডেড মেটাস্টোর:

এম্বেড থাকা ডার্বি ডেটাবেস উদাহরণ ব্যবহার করে মেটাস্টোর পরিষেবা এবং হাইভ উভয়ই একই জেভিএমে ডিফল্টরূপে চালিত হয় যেখানে স্থানীয় ডিস্কে মেটাডেটা সংরক্ষিত থাকে। একে এম্বেডেড মেটাস্টোর কনফিগারেশন বলা হয়। এই ক্ষেত্রে, কেবলমাত্র একজন ব্যবহারকারী একসাথে মেটাস্টোর ডাটাবেসে সংযোগ করতে পারবেন। আপনি যদি Hive ড্রাইভারের দ্বিতীয় উদাহরণটি শুরু করেন তবে আপনি একটি ত্রুটি পাবেন। এটি ইউনিট পরীক্ষার জন্য ভাল, তবে ব্যবহারিক সমাধানের জন্য নয়।

2. স্থানীয় মেটাস্টোর:

এই কনফিগারেশনটি আমাদের একাধিক এইচআইভি সেশনগুলির অনুমতি দেয় অর্থাৎ একাধিক ব্যবহারকারী একই সাথে মেটাস্টোর ডাটাবেস ব্যবহার করতে পারে। উপরের মত একই জেভিএম-তে চালিত হিভ সার্ভিস এবং মেটাস্টোর পরিষেবাদির চেয়ে পৃথক জেভিএম বা একটি পৃথক মেশিনে চলমান মাইএসকিউএলের মতো কোনও জেডিবিসি অনুবর্তী ডাটাবেস ব্যবহার করে এটি অর্জন করা সম্ভব। সাধারণভাবে, সর্বাধিক জনপ্রিয় পছন্দ হ'ল মাইএসকিউএল সার্ভারকে মেটাস্টোর ডেটাবেস হিসাবে প্রয়োগ করা।

রিমোট মেটাস্টোর:

রিমোট মেটাস্টোর কনফিগারেশনে, মেটাস্টোর পরিষেবাটি তার নিজস্ব পৃথক জেভিএম উপর চালিত হয় এবং হিভ পরিষেবা জেভিএমের অন্তর্নিহিত নয়। অন্যান্য প্রক্রিয়া থ্রিফ্ট নেটওয়ার্ক এপিআই ব্যবহার করে মেটাস্টোর সার্ভারের সাথে যোগাযোগ করে। আরও প্রাপ্যতা সরবরাহের জন্য আপনার এক বা একাধিক মেটাস্টোর সার্ভার থাকতে পারে।রিমোট মেটাস্টোর ব্যবহারের প্রধান সুবিধা হ'ল মেটাস্টোর ডেটাবেস অ্যাক্সেস করার জন্য আপনার প্রত্যেকটি মাতাল ব্যবহারকারীর সাথে জেডিবিসি লগইন শংসাপত্র ভাগ করার দরকার নেই।

সি ++ একটি অ্যারে বাছাই করুন

অ্যাপাচি হাইভ টিউটোরিয়াল: ডেটা মডেল

হাইভের ডেটা দানাদার স্তরে তিন প্রকারে শ্রেণিবদ্ধ করা যেতে পারে:

টেবিল
পার্টিশন
বালতি

টেবিলগুলি:

হাইভের টেবিলগুলি রিলেশনাল ডেটাবেজে উপস্থিত টেবিলগুলির সমান। আপনি তাদের উপর ফিল্টার, প্রকল্প, যোগদান এবং ইউনিয়ন পরিচালনা করতে পারেন। হাইভেতে দুটি ধরণের সারণী রয়েছে:

1. পরিচালিত সারণী:

আদেশ:

টেবিল তৈরি করুন (কলাম 1 ডাটা_ টাইপ, কলাম 2 ডেটা_ টাইপ)

লোড ডেটা ইনপ্যাটে ভিতরে টেবিল পরিচালিত_সারণযোগ্য

নামটি যেমন প্রস্তাবিত (পরিচালিত সারণী), হাইভ পরিচালিত টেবিলের ডেটা পরিচালনা করার জন্য দায়বদ্ধ। অন্য কথায়, 'হিভ ডেটা পরিচালনা করে' বলার অর্থ আমি কী বোঝাতে চাইছি তা হ'ল আপনি যদি এইচডিএফএসে উপস্থিত কোনও ফাইল থেকে ডেটা লোভকে লোড করেন? পরিচালিত সারণী এবং এটিতে একটি DROP কমান্ড জারি করুন, এর মেটাডেটা সহ টেবিলটি মুছে ফেলা হবে। সুতরাং, বাদ পড়েছে সম্পর্কিত তথ্য পরিচালিত_সচেতন এইচডিএফএসে আর কোথাও বিদ্যমান নেই এবং আপনি এটি কোনও উপায়ে পুনরুদ্ধার করতে পারবেন না। মূলত, আপনি যখন এইচডিএফএস ফাইল অবস্থান থেকে হাইভ গুদাম ডিরেক্টরিতে লোড কমান্ডটি সরবরাহ করবেন তখন আপনি ডেটা সরিয়ে নিচ্ছেন।

বিঃদ্রঃ: গুদাম ডিরেক্টরিটির ডিফল্ট পাথটি / ব্যবহারকারী / মৌচিক / গুদামে সেট করা আছে। এইচআইভি টেবিলের ডেটা গুদাম_ ডিরেক্টরিতে থাকে in / টেবিলের নাম (এইচডিএফএস)। আপনি hive.metastore.warehouse.dir কনফিগারেশন প্যারামিটার মধ্যে মধুশালী সাইট.এক্সএমএল উপস্থিত গুদাম ডিরেক্টরি ডিরেক্টরি সুনির্দিষ্ট করতে পারেন।

2. বাহ্যিক সারণী:

আদেশ:

বহির্মুখী টেবিল তৈরি করুন (কলাম 1 ডাটা_ টাইপ, কলাম 2 ডেটা_ টাইপ) অবস্থান ''

ডেটা ইনপ্যাট লোড করুন ’’ এতে টেবিল

এনজি-চেঞ্জ বনাম অনচেঞ্জ

জন্য বাহ্যিক টেবিল , হিভ ডেটা পরিচালনার জন্য দায়বদ্ধ নয়। এই ক্ষেত্রে, আপনি যখন LOAD কমান্ড জারি করেন, Hive ডেটাটিকে তার গুদাম ডিরেক্টরিতে সরিয়ে দেয়। তারপরে, হাইভ বাহ্যিক সারণীর জন্য মেটাডেটা তথ্য তৈরি করে। এখন, আপনি যদি একটি DROP কমান্ড জারি করেন বাহ্যিক টেবিল , কেবলমাত্র বাহ্যিক সারণী সম্পর্কিত মেটাডেটা তথ্য মুছে ফেলা হবে। অতএব, আপনি এখনও গুদাম ডিরেক্টরি থেকে এইচডিএফএস কমান্ড ব্যবহার করে খুব বাহ্যিক সারণীর ডেটা পুনরুদ্ধার করতে পারেন।

পার্টিশন:

আদেশ:

টেবিলের টেবিলের নাম তৈরি করুন (কলাম 1 ডাটা_ টাইপ, কলাম 2 ডেটা টাইপ) পার্টিশন বাই বাই (পার্টিশন 1 ডেটা টাইপ, পার্টিশন 2 ডেটা টাইপ, এবং হেল্প।)

কলাম বা পার্টিশন কী এর উপর ভিত্তি করে এই জাতীয় ধরণের ডেটা একসাথে গ্রুপিংয়ের জন্য হাইভ পার্টিশনে টেবিলগুলি সংগঠিত করে। প্রতিটি টেবিলের একটি নির্দিষ্ট পার্টিশন সনাক্ত করতে এক বা একাধিক পার্টিশন কী থাকতে পারে। এটি আমাদের উপাত্তের টুকরোগুলিতে একটি দ্রুত প্রশ্ন করতে দেয়।

বিঃদ্রঃ: মনে রাখবেন, পার্টিশন তৈরি করার সময় সবচেয়ে সাধারণ ভুলটি হ'ল একটি পার্টিশন কলাম হিসাবে বিদ্যমান কলামের নাম উল্লেখ করা specify এটি করার সময়, আপনি একটি ত্রুটি পাবেন - 'শব্দার্থবিজ্ঞানের বিশ্লেষণে ত্রুটি: কলাম বিভাজনে কলামগুলিতে পুনরাবৃত্তি করা হয়েছে'।

আসুন আমরা উদাহরণস্বরূপ পার্টিশনটি বুঝতে পারি যেখানে আমার কাছে কিছু টেবিলের ছাত্র_ডেটেল রয়েছে যাতে কিছু ইঞ্জিনিয়ারিং কলেজের শিক্ষার্থীর তথ্য যেমন শিক্ষার্থী_আইডি, নাম, বিভাগ, বছর ইত্যাদি রয়েছে। এখন, আমি বিভাগ কলামের ভিত্তিতে পার্টিশন সম্পাদন করলে সমস্ত শিক্ষার্থীর তথ্য একটি বিশেষ বিভাগের অন্তর্ভুক্ত সেই বিভাজনে একসাথে সংরক্ষণ করা হবে। শারীরিকভাবে, একটি পার্টিশন টেবিল ডিরেক্টরিতে একটি উপ-ডিরেক্টরি ছাড়া কিছুই নয়।

আসুন ধরা যাক আমাদের ছাত্র_বিজ্ঞানের টেবিলের তিনটি বিভাগের ডেটা রয়েছে - সিএসই, ইসিই এবং সিভিল। সুতরাং, নীচের ছবিতে প্রদর্শিত প্রতিটি বিভাগের জন্য আমাদের মোট তিনটি পার্টিশন থাকবে। এবং, প্রতিটি বিভাগের জন্য আমাদের সেই সমস্ত বিভাগ সম্পর্কে সমস্ত তথ্য থাকবে যা হাইভ টেবিল ডিরেক্টরি অনুসারে একটি পৃথক সাব-ডিরেক্টরিতে থাকে। উদাহরণস্বরূপ, সিএসই বিভাগের সাথে সম্পর্কিত সমস্ত শিক্ষার্থীর ডেটা ব্যবহারকারী / মধুশিল্প / গুদাম / ছাত্র_ত্যাগী / ডিপ্টে সংরক্ষণ করা হবে C সিএসই। সুতরাং, সিএসই শিক্ষার্থীদের সম্পর্কিত অনুসন্ধানগুলি কেবলমাত্র সিএসই বিভাজনে উপস্থিত ডেটাগুলি অনুসন্ধান করতে হবে। এটি বিভাজনকে খুব দরকারী করে তোলে কারণ এটি কেবল স্ক্যান করে ক্যোয়ারির বিলম্বকে হ্রাস করে প্রাসঙ্গিক পুরো ডেটা সেটের পরিবর্তে পার্টিশনযুক্ত ডেটা। প্রকৃতপক্ষে, বাস্তব বিশ্বের বাস্তবায়নে, আপনি শত শত টিবিএস ডেটা নিয়ে কাজ করবেন। সুতরাং, কিছু ক্যোয়ারির জন্য এই বিশাল পরিমাণের ডেটা স্ক্যান করার কল্পনা করুন 95% আপনার দ্বারা স্ক্যান করা ডেটা আপনার প্রশ্নের সাথে সম্পর্কিত নয়।

আমি আপনাকে ব্লগটি চালু করার পরামর্শ দিচ্ছি Hive আদেশ যেখানে আপনি উদাহরণ সহ পার্টিশন প্রয়োগের বিভিন্ন উপায় খুঁজে পাবেন।

বালতি:

আদেশগুলি:

টেবিলের নাম তৈরি করুন (পার্টিশন 1 ডেটা টাইপ, পার্টিশন 2 ডেটা টাইপ, এবং হেল্প।) ক্লাস্টারড বাই (কলাম_নেম 1, কলাম_নাম 2,…) দ্বারা সরেটেড (কলাম_নাম [এএসসি | ডিএসসি],…)] নাম্বার_বকেটগুলি কিনুন

এখন, আপনি টেবিলের একটি কলামের হ্যাশ ফাংশনের উপর ভিত্তি করে প্রতিটি পার্টিশন বা অবিভাজনযুক্ত টেবিলকে বালকেটে ভাগ করতে পারেন। প্রকৃতপক্ষে, প্রতিটি বালতি পার্টিশন ডিরেক্টরি বা টেবিল ডিরেক্টরি (অবিভাজনযুক্ত টেবিল) এর কেবল একটি ফাইল। সুতরাং, আপনি যদি পার্টিশনগুলিকে এন বালতিতে ভাগ করতে চান, আপনার পার্টিশন ডিরেক্টরিতে প্রতিটি ফাইল রয়েছে n উদাহরণস্বরূপ, আপনি উপরের চিত্রটি দেখতে পারেন যেখানে আমরা প্রতিটি পার্টিশনকে ২ টি বালতি তৈরি করেছি। সুতরাং, প্রতিটি বিভাজন, সিএসই বলুন, দুটি ফাইল থাকবে যেখানে সেগুলির প্রতিটি সিএসই শিক্ষার্থীর ডেটা সংরক্ষণ করবে।

কীভাবে হাইভ সারিগুলি বালতিতে বিতরণ করে?

ঠিক আছে, এইচআইভি সূত্রটি ব্যবহার করে একটি সারির জন্য বালতি নম্বর নির্ধারণ করে: হ্যাশ_ফানশন (বালতি_ক্যালোম) মডুলো (নাম_ফ_বকেট) । এখানে, এইচash_function কলামের ডেটা টাইপের উপর নির্ভর করে। উদাহরণস্বরূপ, আপনি যদি কিছু কলামের ভিত্তিতে টেবিলটি বালতি দিচ্ছেন তবে আইএনটি ডেটাটাইপের ব্যবহারকারী_আইডি বলুন, হ্যাশ_ফানশনটি হবে - hash_function (ব্যবহারকারী_আইডি) ) = ব্যবহারকারীর_সংখ্যার পূর্ণসংখ্যা মান । এবং, ধরুন আপনি দুটি বালতি তৈরি করেছেন, তবে এইচআইভ প্রতিটি পার্টিশনে 1 টি বালতিতে সারিগুলি গণনা করে নির্ধারণ করবে: (ব্যবহারকারী_আইডি) এর মান (2)। অতএব, এই ক্ষেত্রে, ব্যবহারকারী_আইডের সারিগুলি এমনকি একটি পূর্ণসংখ্যার অঙ্ক সহ শেষ হবে প্রতিটি পার্টিশনের সাথে সম্পর্কিত একই বালতিতে থাকবে। অন্যান্য ডেটা ধরণের জন্য হ্যাশ_ফাংশন গণনা করা কিছুটা জটিল এবং প্রকৃতপক্ষে, একটি স্ট্রিংয়ের জন্য এটি মানবিকভাবে সনাক্তযোগ্যও নয়।

বিঃদ্রঃ: আপনি যদি অ্যাপাচি হাইভ 0.x বা 1.x ব্যবহার করে থাকেন, আপনাকে বুকটিংয়ের আগে আপনার হাইভ টার্মিনাল থেকে কমান্ডটি সেট করতে হবে - hive.enfor.bucketing = true দিতে হবে। এটি আপনাকে কলাম বকেটিংয়ের জন্য ক্লজ হিসাবে ক্লাস্টার ব্যবহার করার সময় রিডুসারের সঠিক সংখ্যা রাখতে দেয়। যদি আপনি এটি না করেন তবে আপনি দেখতে পাবেন যে আপনার টেবিল ডিরেক্টরিতে যে ফাইল তৈরি হয়েছে সেগুলি বালতির সংখ্যার সমান নয়। বিকল্প হিসাবে, আপনি সেট ম্যাপ্রেড.ড্রেস.টাস্ক = নাম_বকেট ব্যবহার করে বালতি সংখ্যার সমান হ্রাসকারীর সংখ্যাও নির্ধারণ করতে পারেন।

কেন আমাদের বালতি দরকার?

পার্টিশনে বকেটিংয়ের দুটি প্রধান কারণ রয়েছে:

প্রতি মানচিত্রের পার্শ্ব যোগদান একই পার্টিশনে উপস্থিত হওয়ার জন্য একটি অনন্য সংযুক্ত কী সম্পর্কিত ডেটা প্রয়োজন। তবে সেই ক্ষেত্রে কী হবে যেখানে আপনার পার্টিশন কী যোগদানের থেকে আলাদা? অতএব, এই ক্ষেত্রে আপনি জোড় কীটি ব্যবহার করে টেবিলটি বকেট করে একটি মানচিত্রের পার্শ্ব যোগদান করতে পারেন।
বকেটিং স্যাম্পলিং প্রক্রিয়াটিকে আরও দক্ষ করে তোলে এবং সেইজন্য, আমাদের ক্যোয়ারির সময় হ্রাস করতে দেয়।

আমি এই Hive টিউটোরিয়াল ব্লগ এখানে শেষ করতে চাই। আমি এই হাইভ টিউটোরিয়াল ব্লগটি পেরিয়ে যাওয়ার পরেও বেশ নিশ্চিত, আপনি অ্যাপাচি হাইভের সরলতা বুঝতে পেরেছিলেন। যেহেতু, আপনি ছেলেরা সমস্ত হাইভ মৌলিক বিষয়গুলি শিখেছেন, অ্যাপাচি হাইভের সাথে অভিজ্ঞতার কিছুটা হাত রাখা এখন সময় time সুতরাং, এই এইচআইভি টিউটোরিয়াল ব্লগ সিরিজের পরবর্তী ব্লগটি দেখুন যা হিভ ইনস্টলেশনতে রয়েছে এবং অ্যাপাচি হিভে কাজ শুরু করুন।

আপনি যখন অ্যাপাচি হিভ এবং এর বৈশিষ্ট্যগুলি বুঝতে পেরেছেন তবে এটি পরীক্ষা করে দেখুন বিশ্বজুড়ে ছড়িয়ে থাকা 250,000 এরও বেশি সন্তুষ্ট শিক্ষার্থীর নেটওয়ার্ক সহ একটি বিশ্বস্ত অনলাইন লার্নিং সংস্থা এডুরেকা দ্বারা। এডুরেকা বিগ ডেটা হ্যাডোপ শংসাপত্র প্রশিক্ষণ কোর্সটি শিখরদেরকে এইচডিএফএস, সুতা, ম্যাপ্রেইডুস, পিগ, হাইভ, এইচবি, ওউজি, ফ্লুম এবং স্কুওপ রিয়েল, সোশ্যাল মিডিয়া, এভিয়েশন, ট্যুরিজম, ফিনান্স ডোমেইনে রিয়েল-টাইম ব্যবহারের ক্ষেত্রে বিশেষজ্ঞ হতে সহায়তা করে।

আমাদের জন্য একটি প্রশ্ন আছে? দয়া করে মন্তব্য বিভাগে এটি উল্লেখ করুন এবং আমরা আপনার কাছে ফিরে আসব।

Hive টিউটোরিয়াল - Hive আর্কিটেকচার এবং নাসার কেস স্টাডি

অ্যাপাচি হাইভ টিউটোরিয়াল: ভূমিকা

অ্যাপাচি হাইভ টিউটোরিয়াল: মধু কি?

শিক্ষানবিশদের জন্য এইচআইভি টিউটোরিয়াল | গভীরতার মধ্যে মধুচোষা বোঝা | এডুরেকা

অ্যাপাচি হাইভ টিউটোরিয়াল: মাতাল গল্প - ফেসবুক থেকে আপাচে to

ফেসবুকে চ্যালেঞ্জগুলি: ডেটাগুলির তাত্পর্যপূর্ণ বৃদ্ধি

গণতান্ত্রিকীকরণ হ্যাডোপ - মানচিত্রের

অ্যাপাচি হাইভ টিউটোরিয়াল: মাইনের সুবিধা

অ্যাপাচি হাইভ টিউটোরিয়াল: অ্যাপাচি হুভ কোথায় ব্যবহার করবেন?

Hive টিউটোরিয়াল: নাসার কেস স্টাডি

আরসিএমইডি (আঞ্চলিক জলবায়ু মডেল মূল্যায়ন ডাটাবেস):

আরসিএমইটি (আঞ্চলিক জলবায়ু মডেল মূল্যায়ন টুলকিট):

মাইএসকিউএল ডেটাবেস সিস্টেম ব্যবহার করে নাসা দ্বারা সমস্যাগুলি:

কিভাবে অ্যাপাচি হাইভ সমস্যা সমাধান করতে পারে?

মৌচাকের মোতায়েন:

হাইভের সাথে প্রাথমিক বেঞ্চমার্কিং পর্যবেক্ষণ:

মাতাল সম্প্রদায়ের সদস্যদের ইনপুট:

অ্যাপাচি হাইভ টিউটোরিয়াল: হাইভ আর্কিটেকচার এবং এর উপাদানগুলি

মধুচক্র ক্লায়েন্ট:

২. মধুচক্রের পরিষেবাগুলি:

অ্যাপাচি হাইভ টিউটোরিয়াল: মেটাস্টোর কনফিগারেশন

1. এম্বেডেড মেটাস্টোর:

2. স্থানীয় মেটাস্টোর:

রিমোট মেটাস্টোর:

অ্যাপাচি হাইভ টিউটোরিয়াল: ডেটা মডেল

টেবিলগুলি:

1. পরিচালিত সারণী:

2. বাহ্যিক সারণী:

পার্টিশন:

বালতি:

কীভাবে হাইভ সারিগুলি বালতিতে বিতরণ করে?

কেন আমাদের বালতি দরকার?

ধরন

Popular Articles