वर्तमान में jdbchdfs नौकरी में विभाजन पथ < / Strong> आउटपुट निर्देशिका के लिए, जैसे hdfs सिंक ऐसा करने का सुझाव क्या है? मैं इसके लिए किसी भी जीआईआरए भी नहीं देखता हूं, भविष्य में इस तरह के किसी भी योजना के लिए कोई योजना तैयार की जा सकती है?
मैंने इसे एक विचार दिया और निष्कर्ष निकाला है कि वह कई निष्पादन करने वाले विभाजनों के लिए कई फाइलें बना सकता है। हालांकि बड़े डेटा सेट लोड के लिए, हम अपने आउटपुट को डेटा में मानों के आधार पर कई निर्देशिकाओं में तोड़ना चाहते हैं।
अगर मैं ऐसी नौकरी बनाना चाहता हूं, तो मैं बॉक्स के बाहर कैसे पुन: उपयोग कर सकता हूं विभाजन रणनीति जो एचडीएफएस सिंक में उपयोग की जाती है? किसी भी संकेतक की सराहना की जाएगी।
वर्तमान jdbchdfs नौकरी एक बहुत सरल मदर्राफ्टर कार्यान्वयन का उपयोग करता है। यह एक वसंत Hadoop DataWriter कार्यान्वयन का उपयोग करने के लिए बदलना चाहिए और सुधार करने के लिए सीधे दिखाई देता है। मैं कार्यान्वयन के दृष्टिकोण पर एक टिप के साथ इस सुसंगत कार्यक्षमता का ट्रैक रखने के लिए जीआईआरए बनाया। यदि आप इसे बाहर की कोशिश कर सकते हैं और एक जनसंपर्क जारी कर सकते हैं जो बहुत सराहना की जाएगी।
चीयर्स, मार्क
No comments:
Post a Comment