Monday, 15 July 2013

python - Issue with downloading a file using requests library -


<पूर्व> आयात आयात अनुरोध से bs4 BeautifulSoup useragent = "मोज़िला / 5.0 (Macintosh; Intel Mac OS X 10_10_1)" \ "एप्पल वेबकिट / 537.36 (केएचटीएमएल, जिएको जैसे) क्रोम / 40.0.2214.115" \ "सफारी / 537.36" रेफरी = "https://czdap.icann.org/en" org = "https://czdap.icann.org" स्रोत = खुला ('./ tldlocations.txt') url = 'https://czdap.icann.org/en' pload1 = "नाम = उपयोगकर्ता नाम और पास = पास & amp; form_build_id =" pload2 = "& amp; form_id = user_login_block & amp; S = request.ession () आर = s.get (url) सूप = खूबसूरत सूप (r.content) # हमें सूप में इनपुट के लिए हमारे पोस्ट अनुरोध में form_build_id को शामिल करना होगा। Find_all ("इनपुट" ): यदि इनपुट ["नाम"] == "form_build_id": form_build_id = input ["value"] pload = pload1 + 'form_build_id' + pload2 # कुछ शीर्षलेखों के s.headers.update ({'Accept-encoding' : '', 'रेफेरर': रेफरी, 'उत्पत्ति': संगठन, 'उपयोगकर्ता-एजेंट': यूज़रएगेंट, 'कंटेंट-टाइप': 'एप्लिकेशन / एक्स-www-फॉर्म-यूआरएलएक्सोड'}) आर = एस पोस्ट (यूआरएल, डेटा = प्लेड) r = s.get ('https://czdap.icann.org/en/download-zone-data/1885') प्रिंट आर कंटेंट

मैं आईसीएएनएन वेबसाइट से फाइलों के समूह को डाउनलोड करने के लिए इस कोड के कोड का उपयोग करने की कोशिश कर रहा हूं, लेकिन मुझे इसे काम करने में परेशानी हो रही है मुझे जो आउटपुट प्राप्त होता है वह यूनिकोड का एक हिस्सा होता है जो .txt.gz फ़ाइल की सामग्री को दिखता है जिसे मैं डाउनलोड करने का प्रयास कर रहा हूं।

आप कोड में हैं, आप बस अनुरोध कर रहे हैं और वास्तव में किसी भी डेटा को नहीं सहेज रहे हैं इसे आज़माएं, यह अनचाहे है, लेकिन इसे डाउनलोड करना होगा, और फ़ाइल को dlfile

  r = s.get ('https: //czdap.icann) नाम से फाइल में सहेज कर रखनी चाहिए। आर के साथ: r.iter_content (chunk_size = 1024) में चंक के लिए ओपन ('dlfile', 'wb') के साथ ओआरजी / एन / डाउनलोड-ज़ोन-डेटा / 1885 ', स्ट्रीम = ट्रू): अगर चक: # फिल्टर से बाहर रखें -नाली नई खंड एफ.लिटेट (चक) एफ.फ़्लुश ()  

अधिक जानकारी यहां पाई जा सकती है


No comments:

Post a Comment