什么是 IP 地址?

IP 地址是在线基础设施的重要组成部分,它允许我们通过互联网访问和通信。更好地理解 IP 地址是什么可以帮助您确保更安全的在线业务活动和更有效的网络抓取操作。 

在本文中,我们将介绍 IP 地址的概念及其工作原理。此外,我们将概述 Internet 协议地址的主要类型,并提到要牢记的 IP 管理挑战。 

什么是 IP 地址?

就像在现实世界中一样,为了让您的在线购物送货到达您的家,它们需要贴上如何找到您的信息。此信息称为您的街道地址,并指定包裹需要到达的位置。互联网以非常相似的方式工作,您的互联网流量使用所谓的 IP 地址进行标记。 

IP 地址是分配给连接到计算机网络的每个设备的电子地址。IP 首字母缩写词代表 Internet 协议。通常由您的互联网服务提供商 (ISP) 发布,IP 地址是互联网知道将您的搜索和查询的数据和结果发送到哪里的地址。

为了帮助您更清楚地了解情况,下面的数字集合是 IP 地址的示例:

203.0.113.220

通常,IP 地址以分层方式分配。它从国际数字分配机构 (IANA) 开始,它将 IP 地址分块分配给不同的区域互联网注册机构。每个区域互联网注册机构进一步将较小的 IP 地址块分配给国家互联网注册机构。接下来,每个国家的互联网注册机构将 IP 地址块分配给各个 ISP。

IP 地址和 DNS

正如我们已经知道的那样,互联网有自己的规则和协议工作。另一个这样的协议是 DNS(域名系统),并且在许多情况下对于促进连接和通信也是必不可少的。

域名是地址中包含您可以轻松阅读的字母和单词的部分。域类似于以下文本:

Domainnamesystem.com

虽然 IP 地址更容易让计算机理解并记住特定的位置,但对应的域名更容易被人类书写和记住。使用时,域名系统可以将域转换为 IP 地址,以便计算机知道所需的位置。

为了促进这种地址转换,计算机通常使用 DNS 服务器。每台计算机通常至少配置一个 DNS 服务器,通常由 ISP 提供。寻求性能和便利性,这些 DNS 服务器通常位于相对靠近您的位置。

当您访问 Internet 上的内容时,为您提供内容的服务可能具有找出您使用的 DNS 服务器的机制。这可能会产生几个隐私问题。例如,您的 IP DNS 位置很可能(但不一定)位于您所在国家或城市中您周围的任何地方,并且几乎可以用来确定您的确切位置。

域名系统存储公共互联网服务器的名称和地址

IP 地址版本:IPv4 和 IPv6

目前,有两个版本的 IP 地址在使用中:IPv4 和 IPv6

IPv4

IPv4,也称为 Internet 协议版本 4,是在实验版本 IPv1、IPv2 和 IPv3 之后于 1981 年推出的,使其成为第一个在世界范围内公开使用的 IP 版本。使用 32 位,它创建了大约 2 32种可能的组合,转换为近 43 亿(4,294,967,296)个唯一地址。

然而,随着技术的发展,越来越多的需要互联网连接的个人设备迅速超过了有限的 IPv4 唯一地址池。2019 年,五个区域互联网注册机构之一的RIPE NCC报告称,只有 100 万个 IPv4 地址未使用。除其他外,这些限制导致了 IPv6 的诞生。

IPv6

Internet 协议版本 6 于 2012 年发布,以十六进制格式开发。它使用128位生成约2128 个节点,从而产生 340 万亿万亿(340,282,366,920,463,463,374,607,431,768,211,456)个唯一地址。这应该为网络的预期未来增长提供足够的唯一地址。

IPv4 IPv6
1981 年部署 1999 年部署
32 位数字 128 位数字
数字点十进制表示法:
192.168.0.18
字母数字十六进制表示法:
2001:0DB8:85A3:0000:0000:8A2E:0370:7334
43 亿个地址 340 万亿万亿个地址
必须重复使用或遮盖 每个设备可以有一个唯一的地址

IP 地址的类型

通常,有四种类型的 IP 地址:静态和动态,以及私有和公共 IP 地址。我们将查看它们中的每一个,以了解 Internet 协议地址的整体性质。 

静态与动态 IP 地址

静态 IP 地址是 ISP 分配给特定设备的相当恒定的 IP 地址。例如,在您请求更改之前,您当前的 IP 地址可能会保持不变。在发送电子邮件、玩游戏或管理 Web 服务器的情况下,静态 IP 地址有助于保持稳定性并简化在 Internet 上的发现。

另一方面,动态 IP 地址不同,因为它们会自动定期更改。它们是最常见的 IP 地址类型,通常由动态主机配置协议 (DHCP) 分配。 

私有与公共 IP 地址

私有 IP 地址是路由器通过 DHCP 分配给网络中连接的每个设备的私有数字地址。私有 IP 地址有助于将一台设备与另一台设备区分开来,并且通常不会被网络外的任何人看到。路由器充当屏障,可让您使用您希望的任何 IP 地址方案设置专用 IP 网络。

现在,公共 IP 地址由 ISP 分配给网络。任何人都可以看到公共 IP 地址,包括网络外部的人,它是一种识别网络的方法。

当设备通过私有地址(例如 192.168.0.1)在本地与路由器通信时,路由器随后通过您的公共 IP 地址与 Internet 通信。 

IP 地址管理:挑战

凭借有关 IP 地址性质的所有知识,我们可以更好地理解为您的企业执行网络抓取操作时出现的挑战。主要障碍将是这些: 

基于 IP 地址的阻止

在访问网站以执行网络爬取操作时,您应该注意某些服务器使用反机器人措施来检测可疑活动。指示非人为流量后,网站将拒绝访问您的IP地址所属的IP范围。 

通常,为了避免基于 IP 地址的禁令,网络爬虫使用代理来启用轮换 IP 地址,从这些地址将请求发送到数据目标。 

验证码

在您的网络抓取操作期间,您很可能会从一个 IP 地址发送比真实用户同时生成的请求更多的请求。一些网站监控并可以轻松检测他们从特定 IP 地址收到的请求数量。超过某些限制可能会导致阻止您的 IP 地址或使您通过验证码(代表完全自动化的公共图灵测试,以区分计算机和人类)测试。

这个障碍特别耗时,可能会给您的数据收集过程带来负担。我们在另一篇关于CAPTCHA及其工作原理的博客文章中讨论了这个主题。

地理位置限制

通常,用户的位置是通过使用地理定位技术来识别的,包括基于您的 IP 地址的某些信息。虽然某些网站(例如电子商务网站)可能会显示专门为您的地理位置定制的数据(例如定价),但您不会看到全貌,而且您收集的数据也不准确。隐藏您的 IP 地址可以帮助您避免这种情况。 

通过使用代理,您可以屏蔽和更改目标网站可以看到的 IP 地址和 DNS 服务器。例如,无论您的原始位置如何,澳大利亚代理都可以让您访问澳大利亚的任何首选网站,而德国代理仅在德国提供类似目的。这样,无论数据目标在哪里,企业都可以收集特定数据并进行彻底的分析。 

代理服务器的工作原理
代理如何工作

有多种方法可以隐藏您的 IP,每种方法都有其优势和挑战。如果您有兴趣了解更多信息,请阅读有关如何隐藏 IP地址的文章。

结论

IP 地址就像一个虚拟地址,它允许客户端访问服务器并为服务器提供有关将请求的 Web 数据发送回何处的信息。在保持高级隐私措施的同时,执行高效的网络抓取操作和数据分析项目对大多数企业来说至关重要,了解 IP 地址是什么以及它传达什么信息至关重要。

如果您对如何使用代理来满足您的业务需求感兴趣,请查看我们关于“规划 Web Scraping 项目”的文章。此外,了解更多关于在抓取市场领先的电子商务网页时抓取网站而不会被阻止的信息。

赞(0) 打赏
未经允许不得转载:在线代理 » 什么是 IP 地址?

评论 抢沙发

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址