1.jpg

大家在访问网站的时候,肯定会疑惑为什么我的所有信息都会被网站“看到”呢?比如说我上网的地理位置、点击了哪个页面、在网站停留了多长时间、花了多少钱等等。

其实我们的所有操作都会被网站“看到”,也就是被统计起来;网站统计之后的数据就是大家常常听到的 UV、PV、Session 等等之类的网络术语。

网站是如何看到用户的问题,其实专业来讲,是用户识别的问题。接下来,我们一一来展开分析。

一般而言,我们会使用 MAC Address、IP、Cookie、User Agent、Mobile Number、User ID、SIM ID、Email 作为识别用户身份的手段。这些方法都有各自的优劣,比如,移动端常用 Mobile Number、SIM ID 等来识别用户,网站常用 Cookie 来识别用户。而在此,我们也关注 IP 和 Cookie,重点阐述下两者的概念和优劣。

2.jpg

IP,Internet Protocol,独立IP

IP 为计算机网络相互连接进行通信而设计的协议,是连接到网上的所有计算机网络实现相互通信的一套规则,我们每台可以上网的电脑都有一个 IP,且在全世界范围内是唯一的。因此 IP 的唯一性被用来作为网站表现的一个指标。

在向具体说明IP和Cookie的使用之前,先向大家介绍一个实用的工具 GA。

GA,即 Google  Analytics,是 Google 提供的一个统计网站、App 等互联网产品数据的数据分析工具,可以对用户的年龄、性别、地理位置,PV、UV、访问时长、访问页面、跳出率、等指标进行统计,对分析网站或是 App 有很好的帮助作用。

GA 不使用 IP 地址来识别访问者的身份,但是会追踪每个访问者的 IP 地址信息,且整个追踪过程是在 Google 服务器端完成的,不会在 GA 的返回数据中看到。

那么 GA 统计 IP 地址的意义仅是用来识别访问者的地理位置信息。这个地理位置信息会以地图的方式展现给我们,告诉我们用户活跃的大致位置。

3.jpg

Cookie,浏览器缓存

Cookie refers to an HTTP cookie, which is a small piece of data sent from a website and stored on the user’s computer by the user’s web browser

while the user is browsing. At the same time, it also called a web cookie, Internet cookie, browser cookie, or simply cookie.

网站为了辨别用户身份,追踪 session 等数据跟踪而预先储存在用户本地终端上的通常经过加密的数据。Cookie 是网站以一小段文本的形式存放在用户本地终端的信息,以便网站之后的读取,基本能够唯一对应到用户的访问终端,但要预先写入访问终端,同时还是在用户允许使用 Cookie 的前提下。

听起来 Cookie 也有劣势,那为什么我们要放弃使用 IP 的统计而转向使用 cookie 的方式呢?

NZpVrnI4H2DO9dZjjFmQ.png

显而易见,Cookie 比 IP 更准确,这也就是为什么网站现在都使用 Cookie 来识别用户了。那么问题来了,网站是如何通过 Cookie 来识别用户身份的呢?

当用户使用客户端第一次访问某个网站服务器时,比如 Baidu.com,那么 Baidu.con 的网站服务器就会预先写入一段 Cookie 到客户端上。GA 通过随机数和时间戳来生成字符串来唯一标识用户,且还会记录一些访问信息,比如访问的页面、访问的时间等,而当我们再次访问 Baidu.com 的时候,服务器会直接找到 Cookie 信息,更新一些访问信息,但是并不会更改唯一表示的用户信息。之后也会使用 Cookie 对用户的 session、UV、PV 等数均进行统计,也就是生成了大家平日里常见的数据指标了。


关键词:IP cookie 浏览器,用户

上一篇:UI如何处理线上图片文件,降低服务器流量成本 下一篇:为什么互联网科技公司,都喜欢自研业务系统?