python爬虫页面遇到的问题

因为用的是python爬取的是一个asp服务器的数据，在爬取的时候相同的一个网址我直接输入浏览器返回服务器错误，但是我一步一步进去那个网页确实可以的。然后我在这台电脑进去了那个网页。我在另外一台电脑上直接输入我想去的网址却是可以直接进去的。。。。这是什么原因

举报该文章

相关建议 2015-07-25

import urllib2
proxy_support = urllib2.ProxyHandler({'http':'http://XX.XX.XX.XX:XXXX'})
opener = urllib2.build_opener(proxy_support, urllib2.HTTPHandler)
urllib2.install_opener(opener)
content = urllib2.urlopen('http://XXXX').read()

温馨提示：内容为网友见解，仅供参考

当前网址：https://22.t2y.org/zz/c6hic02tciix26sc2sh.html

其他看法

无其他回答

使用Python爬虫时遇到404 Not Found错误解决办法汇总
在Python爬虫的探索中，遇到404 Not Found错误是常见的挫折，它标志着请求的资源在服务器上无法找到。下面是一些解决问题的实用策略，旨在帮助您克服这个难题，确保数据获取的顺利进行。首先，理解错误本质：404 Not Found实际上表明服务器未能找到你请求的链接，可能是链接错误或网站结构的变动。这种情况下，...

Python爬虫错误合集及解决方案
header编码错误，有时候我们从浏览器直接复制请求头中的Cookie时，一定要注意先点击原始内容再复制，否则会出现解码错误。为保险起见，复制的Cookie字符串前面可以加r防止包含特殊字符转义。获取网页HTML乱码，出现这种情况，都是解码问题。可通过浏览器查看网页源代码，确定网页编码格式后在请求时设置对应解码格...

Python爬虫404错误:解决方案总结
在进行网络爬虫开发时，偶遇HTTP 404错误，即“资源不存在”的报错，对爬虫的正常运行构成阻碍。本文针对此问题，总结了Python爬虫遇到404错误的处理方案，以及请求头在其中的重要性。报错信息示例 404错误的报错信息表明请求的页面或资源无法被找到。在爬虫开发中，确保正确处理这类错误，以确保爬虫能高效运行...

python爬虫错误显示“httperror400:badrequest”,应该
遇到“httperror400:badrequest”错误，通常意味着服务器端遇到了问题，可能是因为请求不被允许或者请求参数错误。这可能是由于服务器对爬虫的访问进行了限制，比如设置了访问频率阈值，导致了频繁请求被拦截。为了绕过这种限制，首先需要调整请求头headers，增强请求的伪装性。具体步骤如下：在每次请求之后加入t...

在使用Python爬虫时遇到403 Forbidden错误解决办法汇总
在使用Python爬虫时，遇到403 Forbidden错误是常见的问题，这通常意味着网站对爬虫行为进行了限制。为解决这一问题，本文将提供详细的解决策略，以助您顺利获取所需数据。理解403 Forbidden错误至关重要。这是一种由服务器返回的错误码，表示拒绝了您的请求。网站通常用此方式阻止爬虫程序的访问，以防非正常...

python写的爬虫爬久了就假死怎么回事?
有些网站为了防止爬虫会采取一些措施，比如给你设计一个链接，你打开这个链接后跳到另一个页面，这个页面上还有一个链接，又链接到原来的页面，如果处理不好爬虫就在这死了。还有就是有些跳转会对爬虫有些干扰。其他的话有可能有些网站为了防止爬虫，直接返回403也有可能。具体原因不清楚，但是你可以采取...

Python爬虫遇到乱码怎么办
一般大家看到乱码，下意识的觉得会不会是爬虫爬错东西了？其实没有，这个就是简单的编码的问题。一般在爬虫程序中，涉及到编码格式的地方有两处，一处是在发起请求后，对返回的内容进行解码；另一处是在保存文件时，设置编码格式。下面我们分开来说。1.发起请求，获取网页内容阶段一般的网站的编码格式都...

python爬取数据运行显示页面不存在
js动态无法加载。python爬取数据运行显示页面不存在的原因是：js动态无法加载。直接找网页上请求对应数据的接口URL，请求即可。

python爬虫用了高匿名代理ip,爬快了为什么还是会封掉本机i
Python爬虫遇到封禁问题时，常让人感到困惑和沮丧。理解爬虫的工作原理是解决此类问题的关键。Python爬虫是一种自动化数据抓取工具，其高效性在节省时间成本方面有着显著优势。然而，频繁的抓取活动对服务器构成压力，触发反爬虫策略以保护服务器，导致封禁问题。封禁原因有多种。首先，检查JavaScript是否存在问题...

python爬虫遇到重定向,请问应该怎么解决?每次都要手动获取
重定向是指服务器返回一个中断请求的URL的响应，常见于网站对URL进行修改或重定向至其他页面。不当处理会导致爬虫无法获取所需数据，影响效果。重定向原因主要在于服务器返回特定状态码，如301、302、307等。使用Python请求库时，通过`response.status_code`查看状态码，`response.history`查看重定向历史，`...

相似回答

大家正在搜