APP下载

青春IN词

2017-09-13

青春期健康·青少版 2017年4期
关键词:爬虫大气层搜索引擎

【量子衛星】

量子信号从地面上发射并穿透大气层——卫星接收到量子信号并按需要将其转发到另一特定卫星——量子信号从该特定卫星上再次穿透大气层到达地球某个角落的指定接收地点。2016年8月,中国科学家将发射世界首颗“量子卫星”,这有朝一日或许有助于建立一个极其安全的全球通信网络。全球首颗量子科学实验卫星被正式命名为“墨子号”。

由于量子信号的携带者光子在外层空间传播时几乎没有损耗,如果能够在技术上实现纠缠光子再穿透整个大气层后仍然存活并保持其纠缠特性,人们就可以在卫星的帮助下实现全球化的量子通信。

【数据挖掘】

数据挖掘是从大型数据集中发现可行信息的过程。数据挖掘使用数学分析来派生存在于数据中的模式和趋势。通常,由于这些模式的关系过于复杂或涉及数据过多,因此使用传统数据浏览无法发现这些模式。

这些模式和趋势可以被收集在一起并定义为“数据挖掘模型”。挖掘模型可以应用于特定的方案,例如:

预测:估计销售量、预测服务器负载或服务器停机时间。

风险和概率:选择目标邮递的最佳客戶、确定风险方案的可能保本点、将概率分配给诊断或其他结果。

查找序列:分析购物车中的客户选择,并预测接下来可能发生的事件。

分组:将客户或事件划分到相关的项目分类,分析和预测相关性。

【爬虫】

爬虫(Python)是一种自动获取网页内容的程序,是搜索引擎的重要组成部分。事实上,搜索引擎优化很大程度上就是针对爬虫而做出的优化。爬虫为搜索引擎从万维网上下载网页。

传统爬虫从一个或若干初始网页的URL开始,获得初始网页上的URL,在抓取网页的过程中,不断从当前页面上抽取新的URL放入队列,直到满足系统的一定停止条件。随着网络的迅速发展,万维网成为大量信息的载体,如何有效地提取并利用这些信息成为一个巨大的挑战。搜索引擎(Search Engine),例如传统的通用搜索引擎AltaVista、Yahoo和Google等,作为一个辅助人们检索信息的工具成为用户访问万维网的入口和指南。

猜你喜欢

爬虫大气层搜索引擎
Chrome 99 Canary恢复可移除预置搜索引擎选项
基于Python的网络爬虫和反爬虫技术研究
世界表情符号日
Python反爬虫设计
基于Scrapy框架的分布式网络爬虫的研究与实现
谁抢走了低价机票
假如没有大气层
大气层为什么不逃走
我们为什么需要大气层
大气层里面有什么