அறிமுகம்:
தொழில்நுட்ப உலகில், பெரிய அளவிலான தரவுகளை நாம் சேமித்து செயலாக்கும் விதம் பெருகிய முறையில் முக்கியமானது. இந்த சூழலில்தான் ஹைவ் வெளிப்படுகிறது, இது ஒரு விநியோகிக்கப்பட்ட கட்டமைப்பின் மூலம் திறமையான தரவு நிர்வாகத்தை எளிதாக்க வடிவமைக்கப்பட்ட ஒரு சக்திவாய்ந்த கருவியாகும். இந்த கட்டுரையில், ஹைவ் என்றால் என்ன, அது எவ்வாறு செயல்படுகிறது, அதன் கட்டிடக்கலை மற்றும் முக்கிய அம்சங்களை மையமாகக் கொண்டு விரிவாக ஆராய்வோம். ஹைவ் என்ற கவர்ச்சிகரமான உலகில் எங்களுடன் மூழ்கி, இந்த புரட்சிகரமான தொழில்நுட்பம் எங்கள் தரவுகளுடன் நாம் தொடர்பு கொள்ளும் விதத்தை எவ்வாறு மாற்றுகிறது என்பதைக் கண்டறியவும்.
1. ஹைவ் அறிமுகம்: அது என்ன, எப்படி வேலை செய்கிறது
இந்த பிரிவில், ஹடூப்பில் தரவு செயலாக்கம் மற்றும் பகுப்பாய்வு தளமான ஹைவ் பற்றி அனைத்தையும் அறிந்து கொள்வீர்கள். ஹைவ் என்பது ஒரு திறந்த மூலக் கருவியாகும், இது ஹடூப்பில் சேமிக்கப்பட்ட பெரிய தரவுத் தொகுப்புகளை அணுகுவதற்கும் நிர்வகிப்பதற்கும் வினவல் இடைமுகத்தை வழங்குகிறது. SQL போன்ற வினவல் மொழி மூலம் தரவு பகுப்பாய்வை எளிதாக்குவதே இதன் முக்கிய நோக்கமாகும்.
ஹைவ் என்பது HiveQL நிரலாக்க மொழியை அடிப்படையாகக் கொண்டது, இது பயனர்கள் வினவல்களை எழுதவும் ஹடூப் கோப்பு முறைமையில் கோப்புகளில் சேமிக்கப்பட்ட தரவை மாற்றவும் அனுமதிக்கிறது. இது ஹடூப் எக்ஸிகியூஷன் எஞ்சினுடன் இணைந்து செயல்படுகிறது, இது HiveQL இல் எழுதப்பட்ட வினவல்களை செயலாக்குவதற்கும் செயல்படுத்துவதற்கும் பொறுப்பாகும். ஹைவ் கட்டமைக்கப்பட்ட மற்றும் கட்டமைக்கப்படாத தரவை செயலாக்க ஒரு விருப்பத்தை வழங்குகிறது, இது பரந்த அளவிலான பயன்பாட்டு நிகழ்வுகளுக்கு ஏற்றதாக அமைகிறது.
ஹைவின் முக்கிய அம்சங்களில் ஒன்று, பெரிய அளவிலான தரவுகளில் விநியோகிக்கப்பட்ட மற்றும் இணையான வினவல்களைச் செய்யும் திறன் ஆகும். ஹைவ் தானாகவே வினவல்களை மேம்படுத்துகிறது மற்றும் திறமையான செயல்திறனை உறுதிப்படுத்த இணையான செயலாக்க நுட்பங்களைப் பயன்படுத்துகிறது. கூடுதலாக, ஹைவ் பல முன் வரையறுக்கப்பட்ட செயல்பாடுகள் மற்றும் ஆபரேட்டர்களை வழங்குகிறது, இது தரவை பகுப்பாய்வு செய்வதையும் சிக்கலான கட்டமைப்புகளை கையாளுவதையும் எளிதாக்குகிறது. இந்தப் பகுதி முழுவதும், ஹைவ் எவ்வாறு செயல்படுகிறது மற்றும் உங்கள் திட்டப்பணியில் தரவு செயலாக்கம் மற்றும் பகுப்பாய்விற்கு அதை எவ்வாறு பயன்படுத்தலாம் என்பதை விரிவாக ஆராய்வோம்.
2. ஹைவ் கட்டிடக்கலை: கூறுகள் மற்றும் செயல்பாடு
ஹைவ் என்பது ஹடூப்பின் அடிப்படையில் விநியோகிக்கப்பட்ட தரவு சேமிப்பு மற்றும் செயலாக்க அமைப்பு ஆகும். இந்த பிரிவில், ஹைவ் கட்டிடக்கலையை ஆராய்வோம், அதன் கூறுகள் மற்றும் அவை எவ்வாறு செயல்படுகின்றன என்பதை ஆராய்வோம். ஹைவ் எவ்வாறு கட்டமைக்கப்பட்டுள்ளது என்பதைப் புரிந்துகொள்வது, பெரிய அளவிலான தரவை நிர்வகிப்பதற்கும் பகுப்பாய்வு செய்வதற்கும் அதன் திறனை முழுமையாகப் பயன்படுத்துவதற்கு முக்கியமானது.
ஹைவின் முக்கிய கூறுகளில் ஒன்று மெட்டாஸ்டோர் ஆகும், இது டேபிள் மற்றும் பகிர்வு மெட்டாடேட்டா போன்ற தரவுகளின் அனைத்து கட்டமைப்பு தகவல்களையும் சேமிக்கிறது. மெட்டாடேட்டா வினவல்-உகந்த வடிவத்தில் சேமிக்கப்படுவதால், தரவை விரைவாகவும் திறமையாகவும் அணுகுவதற்கு இது அனுமதிக்கிறது. கூடுதலாக, தரவுத் திட்டம், அட்டவணைகளுக்கு இடையிலான உறவுகள் மற்றும் பிற தொடர்புடைய தகவல்களைப் பற்றிய தகவல்களைச் சேமிக்க ஹைவ் மெட்டாஸ்டோரைப் பயன்படுத்துகிறது.
ஹைவ் இன் மற்றொரு முக்கியமான கூறு ஹைவ் வினவல் மொழி (HQL). இது SQL போன்ற வினவல் மொழியாகும், இது பயனர்கள் ஹைவில் சேமிக்கப்பட்ட தரவுகளுடன் தொடர்பு கொள்ள அனுமதிக்கிறது. பயனர்கள் SELECT, JOIN மற்றும் GROUP BY போன்ற செயல்பாடுகளைப் பயன்படுத்தி சிக்கலான வினவல்களை எழுதலாம், அவற்றின் தேவைக்கேற்ப தரவை பகுப்பாய்வு செய்து மாற்றலாம். தரவு செயலாக்கம் மற்றும் பகுப்பாய்வை எளிதாக்கும் பரந்த அளவிலான உள்ளமைக்கப்பட்ட செயல்பாடுகளையும் ஹைவ் வழங்குகிறது.
3. ஹைவில் டேட்டா மாடலிங்
தகவல்களை ஒழுங்கமைத்து கட்டமைப்பது ஒரு அடிப்படை செயல்முறையாகும் திறம்பட. ஹைவ் என்பது HiveQL வினவல் மொழியைப் பயன்படுத்தி ஹடூப்பில் சேமிக்கப்பட்ட பெரிய அளவிலான தரவுகளின் வினவல்கள் மற்றும் பகுப்பாய்வுகளை அனுமதிக்கும் ஒரு கருவியாகும்.
செயல்படுத்த, வெவ்வேறு படிகளைப் பின்பற்ற வேண்டும்:
- தரவுத் திட்டத்தை வரையறுக்கவும்: அட்டவணைகளின் அமைப்பு வடிவமைக்கப்பட வேண்டும், ஒவ்வொரு நெடுவரிசையின் தரவு வகைகளையும் தேவைப்பட்டால் அட்டவணைகளுக்கு இடையிலான உறவுகளையும் குறிப்பிட வேண்டும். தரவு பகுப்பாய்வு மற்றும் செயலாக்க திறன் ஆகியவற்றின் தேவைகளை கணக்கில் எடுத்துக்கொள்வது முக்கியம்.
- தரவை ஏற்றவும்: ஸ்கீமா வரையறுக்கப்பட்டவுடன், தரவு ஹைவ் டேபிள்களில் ஏற்றப்பட வேண்டும். இது அதைச் செய்ய முடியும் வெளிப்புற கோப்புகளிலிருந்து சுமை கட்டளைகளைப் பயன்படுத்துதல் அல்லது நேரடியாக அட்டவணையில் தரவைச் செருகுவதன் மூலம்.
- உருமாற்றங்கள் மற்றும் வினவல்களைச் செய்யவும்: தரவு ஏற்றப்பட்டதும், HiveQL ஐப் பயன்படுத்தி உருமாற்றங்கள் மற்றும் வினவல்களைச் செய்யலாம். ஹைவ் பலவிதமான செயல்பாடுகள் மற்றும் ஆபரேட்டர்களை கையாளவும் மற்றும் கையாளவும் வழங்குகிறது தரவை பகுப்பாய்வு செய்யவும்.
இது ஒரு சிக்கலான பணியாகும், இது தரவு அமைப்பு மற்றும் பகுப்பாய்வு தேவைகளை நன்கு புரிந்து கொள்ள வேண்டும். உங்கள் டேபிள் ஸ்கீமாவை வடிவமைக்கும்போது செயல்திறன் மற்றும் அளவிடுதல் போன்ற அம்சங்களைக் கருத்தில் கொள்வது முக்கியம். கூடுதலாக, ஹைவில் சேமிக்கப்பட்ட தகவலைப் புரிந்துகொள்வதற்கும் பகுப்பாய்வு செய்வதற்கும் வசதியாக தரவு காட்சிப்படுத்தல் கருவிகளைப் பயன்படுத்துவது நல்லது.
4. HiveQL வினவல் மொழி: அம்சங்கள் மற்றும் தொடரியல்
HiveQL என்பது ஹடூப்பில் தரவு செயலாக்கம் மற்றும் பகுப்பாய்வுக் கருவியான அப்பாச்சி ஹைவில் பயன்படுத்தப்படும் வினவல் மொழியாகும். ஹடூப் கிளஸ்டரில் சேமிக்கப்பட்ட தரவை வினவுவதற்கும் பகுப்பாய்வு செய்வதற்கும் எளிய மற்றும் பழக்கமான வழியை HiveQL பயனர்களுக்கு வழங்குகிறது. HiveQL இன் தொடரியல் SQL ஐப் போன்றது, பாரம்பரிய வினவல் மொழிகளை ஏற்கனவே அறிந்தவர்களுக்கு கற்றுக்கொள்வதையும் பயன்படுத்துவதையும் எளிதாக்குகிறது.
HiveQL இன் முக்கிய அம்சங்களில் ஒன்று, பெரிய அளவில் விநியோகிக்கப்பட்ட தரவுத் தொகுப்புகளைக் கேட்கும் திறன் ஆகும். ஹைவ் தானாகவே வினவல்களை சிறிய பணிகளாகப் பிரித்து, அவற்றைக் கிளஸ்டர் முழுவதும் விநியோகம் செய்து, பெரிய அளவிலான தரவைச் செயலாக்க உதவுகிறது. திறமையாக. கூடுதலாக, HiveQL இணையான வினவல் செயலாக்கத்தையும் ஆதரிக்கிறது, இது தரவு செயலாக்கத்தை மேலும் துரிதப்படுத்துகிறது.
HiveQL இல் வினவல்களை எழுத, மொழியில் பயன்படுத்தப்படும் அடிப்படை தொடரியல் மற்றும் உட்பிரிவுகளை நீங்கள் அறிந்து கொள்ள வேண்டும். மிகவும் பொதுவான சில உட்பிரிவுகளில், SELECT, FROM, WHERE, GROUP by மற்றும் Order By ஆகியவை அடங்கும். இந்த உட்பிரிவுகள் தேவைக்கேற்ப தரவை வடிகட்ட, வரிசைப்படுத்த மற்றும் குழுவாக்க உங்களை அனுமதிக்கின்றன. HiveQL ஆனது கணிதக் கணக்கீடுகள், சரம் செயல்பாடுகள் மற்றும் தேதி மற்றும் நேர செயல்பாடுகள் போன்ற செயல்பாடுகளைச் செய்ய உள்ளமைக்கப்பட்ட செயல்பாடுகளையும் வழங்குகிறது. HiveQL இலிருந்து அதிகமானவற்றைப் பெறுவதற்கு இந்த அம்சங்களையும் அவற்றை எவ்வாறு சரியாகப் பயன்படுத்துவது என்பதையும் அறிந்து கொள்வது அவசியம்.
5. ஹைவ் இல் விநியோகிக்கப்பட்ட தரவு செயலாக்கம்
பெரிய அளவிலான தகவல்களைக் கையாளவும் விரைவான முடிவுகளைப் பெறவும் இது ஒரு திறமையான நுட்பமாகும். ஹைவ் என்பது ஹடூப் அடிப்படையிலான தரவு பகுப்பாய்வு தளமாகும், இது விநியோகிக்கப்பட்ட கோப்பு முறைமைகளில் சேமிக்கப்பட்ட பெரிய தரவுத் தொகுப்புகளில் SQL போன்ற வினவல்களை இயக்க அனுமதிக்கிறது. திறம்பட பயன்படுத்த சில முக்கிய படிகள் கீழே உள்ளன.
1. ஹைவ் கிளஸ்டரை கட்டமைத்தல்: நீங்கள் பயன்படுத்தத் தொடங்கும் முன், ஹைவ் கிளஸ்டரை சரியாக உள்ளமைப்பது முக்கியம். இது அடிப்படையான ஹடூப் கிளஸ்டருக்கான இணைப்பை நிறுவுதல், மெட்டாடேட்டா மற்றும் சேமிப்பக இருப்பிடங்களை உள்ளமைத்தல் மற்றும் கிளஸ்டர் செயல்திறனை மேம்படுத்த உள்ளமைவைச் சரிப்படுத்துதல் ஆகியவற்றை உள்ளடக்கியது.
- ஹடூப் கிளஸ்டருக்கான இணைப்பை நிறுவவும்: பகிர்ந்தளிக்கப்பட்ட தரவைச் செயலாக்க, ஹைவ் ஹடூப் கிளஸ்டரை அணுக வேண்டும். ஹடூப் கிளஸ்டர் இருப்பிடம் மற்றும் அங்கீகார விவரங்களைக் குறிப்பிட, ஹைவ் உள்ளமைவு கோப்புகள் சரியாக உள்ளமைக்கப்பட வேண்டும்.
- மெட்டாடேட்டா மற்றும் சேமிப்பக இடங்களை உள்ளமைக்கவும்: ஹைவ் மெட்டாடேட்டா மற்றும் டேட்டாவை குறிப்பிட்ட இடங்களில் சேமிக்கிறது. ஹைவ் அவற்றைப் பாதுகாப்பாக அணுகுவதை உறுதிசெய்ய, மெட்டாடேட்டா கோப்பகம் மற்றும் தரவு கோப்பகங்கள் கட்டமைக்கப்பட வேண்டும். திறமையான வழி.
- செயல்திறன் அமைப்புகளை சரிசெய்யவும்: க்ளஸ்டர் செயல்திறனை மேம்படுத்த ஹைவ் பரந்த அளவிலான உள்ளமைவு விருப்பங்களை வழங்குகிறது. சிறந்த முடிவுகளைப் பெற, இடையக அளவு மற்றும் பணி இணைப்படுத்தல் போன்ற அளவுருக்களை மாற்றியமைப்பது முக்கியம்.
2. அட்டவணை வடிவமைப்பு: பகிர்ந்தளிக்கப்பட்ட தரவு செயலாக்கத்திற்கு ஹைவ் அட்டவணைகளின் சரியான வடிவமைப்பு அவசியம். தரவு பகிர்வு, கோப்பு வடிவம் மற்றும் சுருக்க வகை போன்ற அம்சங்களை கணக்கில் எடுத்துக்கொள்வது முக்கியம்.
- தரவைப் பிரிக்கவும்: ஹைவ் தரவை பல நெடுவரிசைகளாகப் பிரிக்க அனுமதிக்கிறது, இது வினவல் செயல்திறனை கணிசமாக மேம்படுத்தும். செயலாக்க நேரத்தைக் குறைக்க வினவல்களில் அடிக்கடி பயன்படுத்தப்படும் நெடுவரிசைகளில் தரவைப் பிரிப்பது நல்லது.
- பொருத்தமான கோப்பு வடிவத்தைத் தேர்ந்தெடுக்கவும்: ஹைவ் உரை, அவ்ரோ, பார்க்வெட் மற்றும் ORC போன்ற பல கோப்பு வடிவங்களை ஆதரிக்கிறது. சரியான கோப்பு வடிவமைப்பைத் தேர்ந்தெடுப்பது செயல்திறன் மற்றும் சேமிப்பக பயன்பாட்டில் குறிப்பிடத்தக்க தாக்கத்தை ஏற்படுத்தும். பொருத்தமான வடிவமைப்பைத் தேர்ந்தெடுக்கும்போது தரவு அணுகல் மற்றும் சுருக்கத்தை கருத்தில் கொள்ள வேண்டும்.
- தரவு சுருக்கத்தைப் பயன்படுத்தவும்: தரவு சுருக்கமானது சேமிப்பக இடத்தைக் குறைக்கவும், விநியோகிக்கப்பட்ட செயலாக்க செயல்திறனை மேம்படுத்தவும் உதவும். ஹைவ் ஸ்னாப்பி மற்றும் ஜிஜிப் போன்ற பல சுருக்க அல்காரிதங்களுக்கான ஆதரவை வழங்குகிறது.
6. ஹடூப்புடன் ஹைவ் ஒருங்கிணைப்பு: நன்மைகள் மற்றும் பரிசீலனைகள்
ஹடூப்புடன் ஹைவ்வை ஒருங்கிணைப்பது பல குறிப்பிடத்தக்க நன்மைகளை வழங்குகிறது பயனர்களுக்கு இது பெரிய அளவிலான தரவுகளுடன் வேலை செய்கிறது. ஹைவ் என்பது ஹடூப்பின் மேல் கட்டப்பட்ட தரவு செயலாக்கக் கருவியாகும், இது ஹடூப் கிளஸ்டரில் சேமிக்கப்பட்ட பெரிய தரவுத் தொகுப்புகளை வினவவும் பகுப்பாய்வு செய்யவும் உங்களை அனுமதிக்கிறது. ஹடூப்புடன் ஹைவ் ஒருங்கிணைப்பதன் சில முக்கிய நன்மைகள் கீழே உள்ளன:
- அளவிடுதல்: ஹடூப் கிளஸ்டரில் பல முனைகளில் விநியோகிக்கப்பட்ட பெரிய அளவிலான தரவை செயலாக்க மற்றும் பகுப்பாய்வு செய்ய ஹைவ் பயன்படுத்தப்படலாம். தரவுத் தொகுப்புகள் வளரும்போது செயல்திறன் மற்றும் சேமிப்பகத் திறனை திறம்பட அளவிட இது அனுமதிக்கிறது.
- SQL வினவல்: ஹைவின் முக்கிய நன்மைகளில் ஒன்று அதன் செயல்திறன் ஆகும் SQL வினவல்கள் ஹடூப்பில் சேமிக்கப்பட்ட தரவுகளில். இது SQL மொழியை நன்கு அறிந்த பயனர்களுக்கு தரவு அணுகல் மற்றும் பகுப்பாய்வை எளிதாக்குகிறது.
- சமூகம் மற்றும் ஆதரவு: ஹைவ் பயனர்கள் மற்றும் டெவலப்பர்களின் ஒரு பெரிய சமூகத்தைக் கொண்டுள்ளது, அதாவது டுடோரியல்கள், ஆவணங்கள் மற்றும் குறியீடு எடுத்துக்காட்டுகள் போன்ற ஏராளமான ஆதாரங்கள் ஆன்லைனில் கிடைக்கின்றன. இது கற்றல் மற்றும் சிக்கலைத் தீர்க்கும் செயல்முறையை எளிதாக்குகிறது.
ஹடூப்புடன் ஹைவ்வை ஒருங்கிணைப்பதைக் கருத்தில் கொள்ளும்போது, சில முக்கிய விஷயங்களை மனதில் கொள்ள வேண்டியது அவசியம். இந்த பரிசீலனைகள் செயல்திறனை மேம்படுத்தவும் உங்கள் வரிசைப்படுத்தல் கணினி தேவைகளை பூர்த்தி செய்வதை உறுதிப்படுத்தவும் உதவும். சில பரிசீலனைகள் பின்வருமாறு:
- அட்டவணை வடிவமைப்பு: ஹைவில் திறமையான அட்டவணை வடிவமைப்பு வினவல் செயல்திறனை கணிசமாக மேம்படுத்தும். தரவுப் பகிர்வு, பொருத்தமான தரவு வகைகளைத் தேர்ந்தெடுப்பது மற்றும் தரவு அணுகலை மேம்படுத்த குறியீடுகளைப் பயன்படுத்துவது போன்ற காரணிகளைக் கருத்தில் கொள்வது முக்கியம்.
- தரவு சுருக்கம்: தரவு சுருக்கமானது ஹடூப்பில் தரவுக்குத் தேவையான சேமிப்பிடத்தைக் குறைக்கும், இது வினவல் செயல்திறனை மேம்படுத்தும். தரவு பண்புகள் மற்றும் வினவல் தேவைகளின் அடிப்படையில் பொருத்தமான சுருக்க நுட்பத்தை மதிப்பீடு செய்து தேர்ந்தெடுப்பது முக்கியம்.
- வினவல் திட்டமிடல்: திறமையான செயல்திறனை உறுதிப்படுத்த வினவல்களை மேம்படுத்துவது அவசியம். தரவுப் பகிர்வு, குறியீட்டுத் தேர்வு, தேவையற்ற தரவைக் குறைத்தல் மற்றும் இடையூறுகள் மற்றும் தேவையற்ற கணக்கீடுகளை அகற்ற வினவல்களைத் திருத்துதல் போன்ற வினவல் தேர்வுமுறை கருவிகள் மற்றும் நுட்பங்களைப் பயன்படுத்துவது இதில் அடங்கும்.
7. ஹைவில் வினவல்களை மேம்படுத்துதல்: உத்திகள் மற்றும் நல்ல நடைமுறைகள்
அதிக அளவிலான தரவை செயலாக்கும் போது திறமையான செயல்திறனை உறுதிப்படுத்த ஹைவில் வினவல் மேம்படுத்தல் அவசியம். ஹைவில் உங்கள் வினவல்களை செயல்படுத்துவதை மேம்படுத்தவும், விரைவான மற்றும் திறமையான முடிவுகளைப் பெறவும் உதவும் பல்வேறு உத்திகள் மற்றும் சிறந்த நடைமுறைகளை இந்தக் கட்டுரை உள்ளடக்கும்.
முக்கிய உத்திகளில் ஒன்று அட்டவணை பகிர்வு ஆகும், இது ஒரு குறிப்பிட்ட அளவுகோலின் அடிப்படையில் தரவை சிறிய பகிர்வுகளாகப் பிரிப்பதை உள்ளடக்குகிறது. இது ஒவ்வொரு வினவலிலும் ஸ்கேன் செய்யப்பட்ட தரவின் அளவைக் குறைக்க அனுமதிக்கிறது, இதன் விளைவாக விரைவான செயலாக்கம் கிடைக்கும். கூடுதலாக, தரவுத் தேர்வு மற்றும் வினவல்களில் வடிகட்டலை மேம்படுத்த குறியீடுகள் மற்றும் புள்ளிவிவரங்களைப் பயன்படுத்த பரிந்துரைக்கப்படுகிறது.
மற்றொரு முக்கியமான நடைமுறை இணைப்புகளை மேம்படுத்துவது. ஹைவில், ஒரு அட்டவணையில் உள்ள ஒவ்வொரு வரிசையையும் மற்றொன்றில் உள்ள அனைத்து வரிசைகளுடன் ஒப்பிட வேண்டியதன் காரணமாக, செயல்திறனின் அடிப்படையில் இணைப்பானது விலை உயர்ந்ததாக இருக்கும். இதை மேம்படுத்த, பகிர்வு செய்யப்பட்ட அல்லது குறியீட்டுகளைக் கொண்ட நெடுவரிசைகளில் சேர்வது நல்லது, இது வினவலின் செயலாக்க நேரத்தைக் குறைக்கும். அதேபோல, தேவையற்ற இணைப்புகளைத் தவிர்க்கவும், செயலாக்க முனைகள் முழுவதும் தரவை சமமாக விநியோகிக்க "DISTRIBUTE BY" விதியைப் பயன்படுத்தவும் பரிந்துரைக்கப்படுகிறது.
8. ஹைவில் பகிர்வு மற்றும் சேமிப்பு: திறமையான தரவு அமைப்பு
பகிர்வு மற்றும் ஹைவில் சேமிப்பது என்பது விநியோகிக்கப்பட்ட சேமிப்பக சூழலில் தரவை ஒழுங்கமைப்பதற்கான ஒரு திறமையான நுட்பமாகும். ஹைவில், தரவு ஒன்று அல்லது அதற்கு மேற்பட்ட நெடுவரிசை மதிப்புகளின் அடிப்படையில் தருக்க பகிர்வுகளாக பிரிக்கப்படுகிறது. இது பயனர்கள் முழு தரவு தொகுப்பையும் ஸ்கேன் செய்வதை விட, தொடர்புடைய பகிர்வுகளை மட்டுமே அணுகவும் செயலாக்கவும் அனுமதிக்கிறது.
ஹைவில் பிரித்தல் பல நன்மைகளைக் கொண்டுள்ளது. முதலில், செயலாக்கப்பட வேண்டிய தரவுத் தொகுப்புகளின் அளவைக் குறைப்பதன் மூலம் வினவல் செயல்திறனை மேம்படுத்துகிறது. பெரிய அளவிலான தரவுகளைக் கையாளும் போது இது மிகவும் பயனுள்ளதாக இருக்கும். இரண்டாவதாக, தேதிகள், இருப்பிடங்கள் அல்லது வகைகள் போன்ற குறிப்பிட்ட அளவுகோல்களின் அடிப்படையில் இது பிரிக்கப்படலாம் என்பதால், தரவை சிறப்பாகக் கட்டுப்படுத்தவும் ஒழுங்கமைக்கவும் இது அனுமதிக்கிறது.
ஹைவில் பகிர்வை செயல்படுத்த, அட்டவணையை உருவாக்கும் போது ஒரு பகிர்வு நெடுவரிசையை வரையறுக்க வேண்டும். இந்த நெடுவரிசையில் தேதி அல்லது உரைச் சரம் போன்ற பொருத்தமான தரவு வகை இருக்க வேண்டும். அட்டவணையை உருவாக்கியவுடன், குறிப்பிட்ட பகிர்வுகளில் தரவைச் செருகலாம் INSERT IGNORE INTO TABLE .. PARTITION ... விதியைப் பயன்படுத்தி வினவல்களை இயக்கவும் முடியும் WHERE பகிர்வுகள் மூலம் வடிகட்ட.
9. பிக் டேட்டா சூழல்களில் ஹைவ்: கேஸ்கள் மற்றும் அளவிடுதல் ஆகியவற்றைப் பயன்படுத்தவும்
ஹைவ் என்பது பிக் டேட்டா சூழல்களில் பிரபலமான தரவு செயலாக்க கருவியாகும், இது பரந்த அளவிலான பயன்பாட்டு நிகழ்வுகள் மற்றும் உயர் அளவிடுதல் ஆகியவற்றை வழங்குகிறது. இந்த திறந்த மூல தொழில்நுட்பமானது, கட்டமைக்கப்பட்ட மற்றும் அரை-கட்டமைக்கப்பட்ட தரவுகளின் பெரிய தொகுப்புகளை திறமையாகவும் திறம்படவும் நிர்வகிக்கவும் வினவவும் பயனர்களை அனுமதிக்கிறது.
ஹைவ் மிகவும் பொதுவான பயன்பாட்டு நிகழ்வுகளில் ஒன்று பெரிய தரவு பகுப்பாய்வு ஆகும். பெரிய அளவிலான விநியோகிக்கப்பட்ட தரவுகளில் SQL வினவல்களைச் செயல்படுத்தும் திறனுக்கு நன்றி, ஹைவ் மிகப்பெரிய தரவுத் தொகுப்புகளிலிருந்து மதிப்புமிக்க தகவல்களைப் பிரித்தெடுக்கும் ஒரு முக்கியமான கருவியாக மாறியுள்ளது. சிக்கலான வினவல்களைச் செய்து விரைவாக முடிவுகளைப் பெற பயனர்கள் ஹைவின் ஆற்றலைப் பயன்படுத்தலாம், இது பெரிய தரவு பகுப்பாய்வு திட்டங்களில் குறிப்பாக பயனுள்ளதாக இருக்கும்.
பெரிய தரவு பகுப்பாய்வுக்கு கூடுதலாக, ஹைவ் தரவு தயாரிப்பு மற்றும் மாற்றத்திற்கும் பயன்படுத்தப்படுகிறது. HiveQL எனப்படும் அதன் SQL அடிப்படையிலான வினவல் மொழி மூலம், பயனர்கள் தரவு வடிகட்டுதல், திரட்டுதல் மற்றும் இணைத்தல் செயல்பாடுகளை எளிதாகவும் விரைவாகவும் செய்யலாம். இது நிறுவனங்களை சுத்தம் செய்து தயார்படுத்த அனுமதிக்கிறது உங்கள் தரவு மேம்பட்ட பகுப்பாய்வுகளை செய்வதற்கு முன். கட்டமைக்கப்படாத உரையிலிருந்து தகவல்களைப் பிரித்தெடுத்தல் அல்லது புள்ளியியல் பகுப்பாய்விற்கான தரவைத் திரட்டுதல் போன்ற தரவு கையாளுதலை எளிதாக்கும் உள்ளமைக்கப்பட்ட கருவிகள் மற்றும் செயல்பாடுகளையும் ஹைவ் வழங்குகிறது.
10. ஹைவ் மற்றும் பிற தரவு பகுப்பாய்வு கருவிகளுடன் ஒருங்கிணைப்பு
தரவு பகுப்பாய்வு உலகில் ஹைவ் ஒரு பிரபலமான கருவியாகும், ஏனெனில் பெரிய அளவிலான தகவல்களை திறம்பட செயலாக்கும் திறன் கொண்டது. இருப்பினும், மற்ற தரவு பகுப்பாய்வு கருவிகளுடன் ஒருங்கிணைப்பதன் மூலம் அதன் உண்மையான சக்தி திறக்கப்படுகிறது. இந்தப் பிரிவில், உங்கள் பகுப்பாய்வுத் திறன்களை மேலும் மேம்படுத்த, ஹைவ் மற்ற கருவிகளுடன் ஒருங்கிணைக்கப்படக்கூடிய சில வழிகளை ஆராய்வோம்.
Apache Hadoop உடன் Hive ஐப் பயன்படுத்துவதன் மூலம் ஒருங்கிணைப்பதற்கான பொதுவான வழிகளில் ஒன்றாகும். ஹடூப்பின் மேல் ஹைவ் இயங்குகிறது, இது ஹடூப் வழங்கும் அனைத்து விநியோகிக்கப்பட்ட செயலாக்கம் மற்றும் அளவிடக்கூடிய சேமிப்பக திறன்களைப் பயன்படுத்திக் கொள்ள உங்களை அனுமதிக்கிறது. இதன் பொருள் நாம் பெரிய அளவிலான தரவை இணையாகச் செயல்படுத்தி விரைவான முடிவுகளைப் பெற முடியும்.
ஹைவ் உடன் ஒருங்கிணைக்கக்கூடிய மற்றொரு பிரபலமான கருவி அப்பாச்சி ஸ்பார்க். ஸ்பார்க் ஒரு வேகமான, நினைவகத்தில் செயல்படும் இயந்திரம் அது பயன்படுத்தப்படுகிறது தரவு செயலாக்கத்திற்காக நிகழ்நேரத்தில் மற்றும் நினைவக பகுப்பாய்வு. ஹைவ்வை ஸ்பார்க்குடன் இணைப்பதன் மூலம், ஸ்பார்க்கின் வேகம் மற்றும் செயலாக்க ஆற்றலைப் பயன்படுத்திக் கொள்ளலாம், அதே நேரத்தில் ஹைவ் சிக்கலான வினவல்களைச் செய்யவும் அதன் SQL போன்ற வினவல் மொழியைப் பயன்படுத்திக் கொள்ளவும் அனுமதிக்கிறது.
11. ஹைவில் பாதுகாப்பு மற்றும் அணுகல் மேலாண்மை
பாதுகாப்பை உறுதி செய்வதற்கும் ஹைவ் அணுகலை நிர்வகிப்பதற்கும், பல்வேறு பாதுகாப்பு நடவடிக்கைகளை செயல்படுத்துவது அவசியம். சில பரிந்துரைகள் மற்றும் பின்பற்ற வேண்டிய முக்கியமான படிகள் கீழே உள்ளன:
1. பயனர்கள் மற்றும் பாத்திரங்களை உருவாக்கவும்: தரவுக்கான அணுகலைக் கட்டுப்படுத்த ஹைவில் பயனர்கள் மற்றும் பாத்திரங்களை உருவாக்குவது அவசியம். வெவ்வேறு செயல்பாடுகளுக்கு குறிப்பிட்ட பாத்திரங்களை உருவாக்கலாம் மற்றும் தேவைக்கேற்ப பயனர்களுக்கு அணுகல் சலுகைகளை ஒதுக்கலாம். எடுத்துக்காட்டாக, நீங்கள் முழு அணுகலுடன் "நிர்வாகி" பாத்திரத்தை உருவாக்கலாம் மற்றும் குறிப்பிட்ட அட்டவணைகள் அல்லது தரவுத்தளங்களுக்கு வரையறுக்கப்பட்ட அணுகலுடன் "ஆலோசகர்" பாத்திரங்களை உருவாக்கலாம்.
2. பாதுகாப்பான அங்கீகாரத்தை அமைக்கவும்: அங்கீகரிக்கப்பட்ட பயனர்கள் மட்டுமே தரவை அணுக முடியும் என்பதை உறுதிப்படுத்த ஹைவில் பாதுகாப்பான அங்கீகாரத்தை உள்ளமைக்க பரிந்துரைக்கப்படுகிறது. கெர்பரோஸ் அல்லது எல்டிஏபி போன்ற அங்கீகார முறைகளைப் பயன்படுத்துவது இதில் அடங்கும். எடுத்துக்காட்டாக, Kerberos ஐப் பயன்படுத்தி, பாதுகாப்பு டிக்கெட்டுகளை பரிமாறிக்கொள்வதன் மூலம் கிளையன்ட் மற்றும் ஹைவ் சேவையகத்திற்கு இடையே பாதுகாப்பான இணைப்பை ஏற்படுத்தலாம்.
3. அங்கீகார கொள்கைகளை அமைக்கவும்: பயனர்கள் மற்றும் பாத்திரங்களை உருவாக்குவதுடன், ஹைவில் தரவு அணுகலை நிர்வகிப்பதற்கான அங்கீகாரக் கொள்கைகளை உருவாக்குவது முக்கியம். இந்தக் கொள்கைகள் SQL அறிக்கைகளைப் பயன்படுத்தி வரையறுக்கப்பட்டு, அட்டவணையை வினவுதல், தரவைச் செருகுதல் அல்லது அட்டவணையின் கட்டமைப்பை மாற்றுதல் போன்ற குறிப்பிட்ட செயல்பாடுகளைச் செய்ய எந்தப் பயனர்கள் அல்லது பாத்திரங்கள் அனுமதிக்கப்படுகின்றன என்பதைத் தீர்மானிக்கின்றன. தரவுத்தளம்.
12. ஹடூப் சுற்றுச்சூழல் அமைப்பில் ஹைவ் எதிராக மற்ற தரவு செயலாக்க தீர்வுகள்
ஹடூப் தரவு செயலாக்கத் தளமானது, பெரிய அளவிலான தகவல்களின் திறமையான மேலாண்மை மற்றும் பகுப்பாய்வுக்கான பல தீர்வுகளை வழங்குகிறது. மிகவும் பிரபலமான விருப்பங்களில் ஒன்று ஹைவ் ஆகும், இது ஹடூப்பில் சேமிக்கப்பட்ட கட்டமைக்கப்பட்ட தரவை வினவுவதற்கும் பகுப்பாய்வு செய்வதற்கும் SQL போன்ற வினவல் இடைமுகத்தை வழங்குகிறது. ஹடூப் சுற்றுச்சூழல் அமைப்பில் பிற தரவு செயலாக்க தீர்வுகள் இருந்தாலும், ஹைவ் அதன் பயன்பாட்டின் எளிமை மற்றும் தற்காலிக வினவல்களுக்கான திறன்களுக்காக தனித்து நிற்கிறது.
Hive இன் முக்கிய நன்மைகளில் ஒன்று HiveQL எனப்படும் அதன் வினவல் மொழியில் உள்ளது, இது பயனர்கள் வினவல்கள் மற்றும் தரவு பகுப்பாய்வு செய்ய SQL போன்ற தொடரியல் பயன்படுத்த அனுமதிக்கிறது. புதிய நிரலாக்க மொழியைக் கற்கத் தேவையில்லை என்பதால், SQL உடன் நன்கு அறிந்த ஆய்வாளர்கள் மற்றும் டெவலப்பர்கள் ஹைவ்வை ஏற்றுக்கொள்வதை இது எளிதாக்குகிறது. கூடுதலாக, ஹைவ் தரவுகளைப் படிக்கக்கூடிய வெளிப்புற அட்டவணைகளை உருவாக்கும் திறனை வழங்குகிறது வெவ்வேறு வடிவங்கள், CSV, JSON அல்லது parquet போன்றவை.
ஹைவின் மற்றொரு முக்கிய அம்சம் ஹடூப் கிளஸ்டர் முழுவதும் விநியோகிக்கப்பட்ட முறையில் வினவல்களை இயக்கும் திறன் ஆகும். ஹைவ் ஹடூப்பின் இணையான செயலாக்க திறன்களை கிளஸ்டரில் உள்ள பல முனைகளில் வினவல்களைப் பிரித்து செயல்படுத்துகிறது, செயல்திறன் மற்றும் செயலாக்க வேகத்தை கணிசமாக மேம்படுத்துகிறது. கூடுதலாக, ஹைவ் வினவல்களின் செயல்திறனை மேலும் மேம்படுத்த, பயன்படுத்தப்படாத நெடுவரிசைகளை அகற்றுவது அல்லது செயலாக்கப்பட்ட தரவுத் தொகுப்புகளின் அளவைக் குறைக்க அட்டவணைகளைப் பகிர்வது போன்ற தானியங்கி மேம்படுத்தல்களைச் செய்கிறது.
13. ஹைவ் கிளஸ்டர் கண்காணிப்பு மற்றும் மேலாண்மை
பெரிய தரவு சூழல்களில் உகந்த செயல்திறன் மற்றும் அதிக கிடைக்கும் தன்மையை உறுதி செய்வதில் இது ஒரு முக்கிய பகுதியாகும். இந்தப் பணிகளைத் திறம்படச் செய்வதற்கு நீங்கள் கவனத்தில் கொள்ள வேண்டிய சில முக்கியமான அம்சங்களை இங்கே நாங்கள் முன்வைக்கிறோம்.
1. செயல்திறன் கண்காணிப்பு: சாத்தியமான இடையூறுகளைக் கண்டறிந்து உங்கள் ஹைவ் கிளஸ்டரின் செயல்திறனை மேம்படுத்த, அம்பாரி அல்லது கிளவுடரா மேலாளர் போன்ற கண்காணிப்பு கருவிகளைப் பயன்படுத்துவது நல்லது. இந்தக் கருவிகள், ஆதாரங்களின் பயன்பாடு, வினவல் பதில் நேரங்கள், வேலைகளைச் செயல்படுத்துதல் போன்றவற்றின் நிகழ்நேர அளவீடுகளைப் பெற உங்களை அனுமதிக்கின்றன. செயல்திறன் கண்காணிப்பு, சரியான நேரத்தில் சிக்கல்களைக் கண்டறிந்து தீர்க்க உதவும்.
2. வள மேலாண்மை: உங்கள் ஹைவ் கிளஸ்டரின் உகந்த பயன்பாட்டை உறுதிசெய்ய திறமையான வள மேலாண்மை அவசியம். போன்ற கருவிகளைப் பயன்படுத்தலாம் நூல் (இன்னொரு ஆதாரப் பேச்சுவார்த்தையாளர்) இயங்கும் பயன்பாடுகளுக்கு வளங்களை நிர்வகிக்கவும் ஒதுக்கவும். கூடுதலாக, வெவ்வேறு பயனர்கள் மற்றும் குழுக்களுக்கான ஆதார வரம்புகள் மற்றும் ஒதுக்கீடுகளை சரியாக உள்ளமைப்பது முக்கியம். சரியான வள மேலாண்மை திறன் பற்றாக்குறை சிக்கல்களைத் தவிர்க்கும் மற்றும் கிளஸ்டர் வளங்களின் சமமான விநியோகத்தை அனுமதிக்கும்.
3. வினவல் உகப்பாக்கம்: வினவல்களை மேம்படுத்தவும் தரவு செயலாக்க வேலைகளின் செயல்திறனை மேம்படுத்தவும் ஹைவ் பல்வேறு நுட்பங்களையும் கருவிகளையும் வழங்குகிறது. போன்ற கருவிகளைப் பயன்படுத்தலாம் நிறம் மாறுதல் வினவல்களை இணையாகச் செயல்படுத்துவதற்கு அல்லது பிரித்தல் மூலம் அல்லது வரிசைப்படுத்துதல் போன்ற உட்பிரிவுகளைப் பயன்படுத்தி உகந்த வினவல்களை எழுதுவதற்கு. மேலும், வினவல் செயலாக்கத் திட்டத்தை ஆய்வு செய்து, பதிலளிப்பு நேரத்தை மேம்படுத்த பொருத்தமான குறியீடுகள் மற்றும் புள்ளிவிவரங்களைப் பயன்படுத்துவது நல்லது. நல்ல வினவல் தேர்வுமுறையானது விரைவான மற்றும் திறமையான முடிவுகளைப் பெற உங்களை அனுமதிக்கும்.
14. ஹைவில் உள்ள சவால்கள் மற்றும் எதிர்கால போக்குகள் மற்றும் அது எவ்வாறு செயல்படுகிறது
சமீபத்திய ஆண்டுகளில், ஹைவ் மிகப்பெரிய வளர்ச்சியை அடைந்துள்ளது மற்றும் அதன் செயல்பாட்டில் பல்வேறு சவால்களை எதிர்கொண்டுள்ளது. இந்த தரவு செயலாக்க தளம் மிகவும் பிரபலமாகி வருவதால், அதன் செயல்திறன் மற்றும் செயல்திறனை பாதிக்கும் தற்போதைய சவால்கள் மற்றும் எதிர்கால போக்குகளை பகுப்பாய்வு செய்வது முக்கியம்.
ஹைவ் முக்கிய சவால்களில் ஒன்று செயல்திறன் மேம்படுத்தல் ஆகும். தரவுகளின் அளவு வளரும்போது, வினவல் வேகத்தை மேம்படுத்துவதற்கும் செயலாக்க நேரத்தைக் குறைப்பதற்கும் வழிகளைக் கண்டறிவது முக்கியம். இந்த சவாலை எதிர்கொள்ள, தரவுகளின் சரியான பகிர்வு மற்றும் அட்டவணைப்படுத்தல் மற்றும் தரவு தொகுப்புகளின் அளவைக் குறைக்க சுருக்க நுட்பங்களைப் பயன்படுத்துவது முக்கியம். க்ளஸ்டர் உள்ளமைவை மேம்படுத்துவது மற்றும் செயல்திறன் தடைகளை கண்டறிந்து தீர்க்க கண்காணிப்பு கருவிகளைப் பயன்படுத்துவதும் அவசியம்.
ஹைவில் சேமிக்கப்பட்ட தரவின் பாதுகாப்பை உறுதி செய்வது மற்றொரு முக்கிய சவாலாகும். இணைய அச்சுறுத்தல்கள் அதிகரித்து வருவதால், முக்கியமான தகவல்களைப் பாதுகாக்க வலுவான பாதுகாப்பு நடவடிக்கைகளைச் செயல்படுத்துவது அவசியம். ஓய்வு மற்றும் போக்குவரத்தில் தரவின் குறியாக்கம், பயனர் அங்கீகாரம் மற்றும் பங்கு அடிப்படையிலான அணுகல் கட்டுப்பாடு ஆகியவை இதில் அடங்கும். கூடுதலாக, சமீபத்திய பாதுகாப்புப் போக்குகளில் முதலிடம் பெறுவதும், போதுமான தரவுப் பாதுகாப்பை உறுதிசெய்ய பேட்ச்கள் மற்றும் புதுப்பிப்புகளை தொடர்ந்து பயன்படுத்துவதும் முக்கியம்.
மேலும், எதிர்காலத்தில் வளர்ந்து வரும் தொழில்நுட்பங்களின் ஒருங்கிணைப்பு தொடர்பான சவால்களை ஹைவ் எதிர்கொள்ளும் என எதிர்பார்க்கப்படுகிறது. நிகழ்நேர செயலாக்கத்தின் அதிகரித்துவரும் பிரபலத்துடன் செயற்கை நுண்ணறிவு, ஹைவ் இந்தத் தொழில்நுட்பங்களைப் பயன்படுத்திக் கொள்ளவும், பிக் டேட்டா உலகில் தொடர்புடையதாக இருக்கவும் மாற்றியமைக்க வேண்டும். மேம்பட்ட தரவு செயலாக்கம் மற்றும் பகுப்பாய்வு திறன்களை வழங்குவதற்கு புதிய செயல்பாடு மற்றும் செயல்திறன் மேம்பாடுகளைச் சேர்க்க இது தேவைப்படும்.
முடிவில், ஹைவ் செயல்திறன், பாதுகாப்பு மற்றும் வளர்ந்து வரும் தொழில்நுட்பங்களுக்குத் தழுவல் ஆகியவற்றின் அடிப்படையில் சவால்களை எதிர்கொள்கிறது. இந்த சவால்களை சமாளிக்க, கிளஸ்டர் செயல்திறனை மேம்படுத்துவது, வலுவான பாதுகாப்பு நடவடிக்கைகளை செயல்படுத்துவது மற்றும் பிக் டேட்டாவில் எதிர்கால போக்குகளில் முதலிடம் பெறுவது முக்கியம். இந்த உத்திகளைக் கொண்டு, ஹைவ் பெரிய அளவிலான தரவு செயலாக்கத்திற்கான நம்பகமான மற்றும் திறமையான தளமாகத் தொடர முடியும்.
முடிவில், ஹைவ் என்பது ஒரு பெரிய தரவு மற்றும் வணிக பகுப்பாய்வு தளமாகும், இது பெரிய அளவிலான தரவை திறமையான மற்றும் அளவிடக்கூடிய முறையில் செயலாக்க நிறுவனங்களுக்கு உதவுகிறது. HiveQL வினவல் மொழியைப் பயன்படுத்தி, பயனர்கள் ஹடூப் போன்ற விநியோகிக்கப்பட்ட சேமிப்பக அமைப்புகளில் சேமிக்கப்பட்ட தரவுத் தொகுப்புகளில் சிக்கலான வினவல்களைச் செய்யலாம். ஹைவ் அடிப்படை உள்கட்டமைப்பின் மேல் சுருக்கத்தை வழங்குகிறது, இது IT வல்லுநர்கள் மற்றும் தரவு ஆய்வாளர்களுக்கு நிகழ்நேர பகுப்பாய்வு மற்றும் துல்லியமான மற்றும் பொருத்தமான தகவல்களின் அடிப்படையில் முடிவுகளை எடுப்பதை எளிதாக்குகிறது. அதன் நெகிழ்வான கட்டமைப்பு மற்றும் அரை-கட்டமைக்கப்பட்ட தரவை செயலாக்கும் திறன் ஆகியவை தரவு பகுப்பாய்வு துறையில் ஹைவ் ஒரு விலைமதிப்பற்ற கருவியாக ஆக்குகின்றன. கூடுதலாக, அப்பாச்சி ஸ்பார்க் போன்ற பிற பிரபலமான கருவிகள் மற்றும் தொழில்நுட்பங்களுடன் அதன் ஒருங்கிணைப்பு, அதன் செயல்பாடு மற்றும் செயல்திறனை மேலும் விரிவுபடுத்துகிறது.
நிறுவன சூழலில் தரவு வெடிப்புடன் நிறுவனங்கள் தொடர்ந்து போராடுவதால், ஹைவ் தன்னை ஒரு வலுவான மற்றும் நம்பகமான தீர்வாகக் காட்டுகிறது. விநியோகிக்கப்பட்ட கம்ப்யூட்டிங் மற்றும் இணையான செயலாக்கத்தின் நன்மைகளைப் பயன்படுத்துவதன் மூலம், ஹைவ் வணிகங்களுக்கு மதிப்புமிக்க நுண்ணறிவுகளைப் பெறவும் தகவலறிந்த முடிவுகளை எடுக்கவும் உதவுகிறது, இது நிலையான போட்டி நன்மைக்கு வழிவகுக்கிறது.
பெரிய தரவு சூழல் மற்றும் HiveQL வினவல் மொழி தெரியாதவர்களுக்கு ஹைவ் ஒரு கற்றல் வளைவைக் கொண்டிருக்கலாம் என்றாலும், நிறுவனங்கள் தங்கள் தரவை நிர்வகிக்கும் முறையை மாற்றும் திறன் மறுக்க முடியாதது. வினவல்களை அனுமதிப்பதன் மூலம் தற்காலிகமாக, மேம்பட்ட பகுப்பாய்வு மற்றும் அர்த்தமுள்ள தகவல்களைப் பிரித்தெடுத்தல், வணிகச் சூழலில் பெரிய தரவு செயலாக்கத்திற்கான சக்திவாய்ந்த கருவியாக ஹைவ் மாறியுள்ளது. சுருக்கமாக, இன்றைய தரவு பகுப்பாய்வு நிலப்பரப்பில் ஹைவ் ஒரு முக்கிய தொழில்நுட்பம் மற்றும் நுண்ணறிவு கண்டுபிடிப்பு மற்றும் தரவு சார்ந்த முடிவெடுப்பதற்கான புதிய சாத்தியங்களைத் திறக்கிறது.
நான் செபாஸ்டியன் விடல், தொழில்நுட்பம் மற்றும் DIY மீது ஆர்வமுள்ள கணினி பொறியாளர். மேலும், நான் உருவாக்கியவன் tecnobits.com, தொழில்நுட்பத்தை மேலும் அணுகக்கூடியதாகவும், அனைவருக்கும் புரிந்துகொள்ளக்கூடியதாகவும் மாற்றுவதற்காக நான் பயிற்சிகளைப் பகிர்ந்துகொள்கிறேன்.