<पूर्व>
आयात आयात अनुरोध से bs4 BeautifulSoup useragent = "मोज़िला / 5.0 (Macintosh; Intel Mac OS X 10_10_1)" \ "एप्पल वेबकिट / 537.36 (केएचटीएमएल, जिएको जैसे) क्रोम / 40.0.2214.115" \ "सफारी / 537.36" रेफरी = "https://czdap.icann.org/en" org = "https://czdap.icann.org" स्रोत = खुला ('./ tldlocations.txt') url = 'https://czdap.icann.org/en' pload1 = "नाम = उपयोगकर्ता नाम और पास = पास & amp; form_build_id =" pload2 = "& amp; form_id = user_login_block & amp; S = request.ession () आर = s.get (url) सूप = खूबसूरत सूप (r.content) # हमें सूप में इनपुट के लिए हमारे पोस्ट अनुरोध में form_build_id को शामिल करना होगा। Find_all ("इनपुट" ): यदि इनपुट ["नाम"] == "form_build_id": form_build_id = input ["value"] pload = pload1 + 'form_build_id' + pload2 # कुछ शीर्षलेखों के s.headers.update ({'Accept-encoding' : '', 'रेफेरर': रेफरी, 'उत्पत्ति': संगठन, 'उपयोगकर्ता-एजेंट': यूज़रएगेंट, 'कंटेंट-टाइप': 'एप्लिकेशन / एक्स-www-फॉर्म-यूआरएलएक्सोड'}) आर = एस पोस्ट (यूआरएल, डेटा = प्लेड) r = s.get ('https://czdap.icann.org/en/download-zone-data/1885') प्रिंट आर कंटेंट
मैं आईसीएएनएन वेबसाइट से फाइलों के समूह को डाउनलोड करने के लिए इस कोड के कोड का उपयोग करने की कोशिश कर रहा हूं, लेकिन मुझे इसे काम करने में परेशानी हो रही है मुझे जो आउटपुट प्राप्त होता है वह यूनिकोड का एक हिस्सा होता है जो .txt.gz फ़ाइल की सामग्री को दिखता है जिसे मैं डाउनलोड करने का प्रयास कर रहा हूं।
आप कोड में हैं, आप बस अनुरोध कर रहे हैं और वास्तव में किसी भी डेटा को नहीं सहेज रहे हैं इसे आज़माएं, यह अनचाहे है, लेकिन इसे डाउनलोड करना होगा, और फ़ाइल को dlfile
r = s.get ('https: //czdap.icann) नाम से फाइल में सहेज कर रखनी चाहिए। आर के साथ: r.iter_content (chunk_size = 1024) में चंक के लिए ओपन ('dlfile', 'wb') के साथ ओआरजी / एन / डाउनलोड-ज़ोन-डेटा / 1885 ', स्ट्रीम = ट्रू): अगर चक: # फिल्टर से बाहर रखें -नाली नई खंड एफ.लिटेट (चक) एफ.फ़्लुश ()
अधिक जानकारी यहां पाई जा सकती है
No comments:
Post a Comment