Python网络爬虫:从入门到精通在线阅读

Python网络爬虫:从入门到精通

吕云翔主编
开会员,本书8折购 >

教材教辅研究生/本科/专科教材11.2万字

更新时间:2023-10-25 19:34:57 最新章节:参考文献

立即阅读
加书架
下载
听书

书籍简介

本书主要介绍如何使用Python语言进行网络爬虫程序的开发,从Python语言的基本特性入手,详细介绍Python网络爬虫开发的多个方面,涉及HTTP、HTML、正则表达式、JavaScript、自然语言处理、数据处理与科学计算等不同领域的内容。全书共12章,包括基础篇、进阶篇、提高篇和实战篇4个部分。基础篇包括第1、2、3章,分别为Python基础及网络爬虫、静态网页抓取、数据存储。进阶篇包括第4、5、6章,分别为JavaScript与动态内容、模拟登录与验证码、爬虫数据的分析与处理。提高篇包括第7、8、9章,分别为爬虫的灵活性和多样性、Selenium模拟浏览器与网站测试、爬虫框架Scrapy与反爬虫。实战篇提供了3个实战项目供读者学习参考。本书内容覆盖网络数据抓取与爬虫编程中的主要知识和前沿技术。同时,本书在重视理论基础的前提下,从实用性和丰富度出发,结合实例演示爬虫程序编写的核心流程,将理论与实践结合,力求提高读者的网络爬虫实操技能。本书可作为高等院校数据科学、统计学、计算机科学、软件工程等相关专业课程的教材,也可作为Python语言初学者、网络爬虫技术爱好者的参考书。
品牌:人邮图书
上架时间:2023-07-01 00:00:00
出版社:人民邮电出版社
本书数字版权由人邮图书提供,并由其授权上海阅文信息技术有限公司制作发行

最新章节

吕云翔主编
主页

同类热门书

最新上架

  • 随着新媒体的影响力不断提升,越来越多的企业将运营重心转移到新媒体领域,这也对新媒体从业人员提出了更高的要求。本书从新媒体运营和推广的角度出发,首先介绍新媒体运营与推广的基础知识,其次阐述用户运营、内容运营和活动运营的知识,最后从微信运营、微博运营、短视频运营、直播运营和其他新媒体运营的角度,系统、全面地讲解新媒体运营与推广的内容,帮助读者学习并掌握新媒体运营与推广的知识和技能。本书可以作为高等院校
    高功步 罗蓓蓓主编教材教辅12.2万字
  • 会员
    本书以任务驱动为主线,围绕企业级应用进行项目任务设计,介绍了平台的本地模式安装、伪分布式模式安装及完全分布式模式安装,并基于Hadoop2.X生态系统,全面讲解了Hive环境搭建与基本操作、ZooKeeper环境搭建与基本操作、HBase环境搭建与基本操作、Hadoop常用工具组件的安装与应用、集群搭建与管理,以及Hadoop平台应用综合案例等相关知识及操作技能。本书具有实用性和可操作性强、语言
    米洪 张鸰主编教材教辅6.2万字
  • 会员
    如今的组织管理中,四个最基本的关系:个人与目标的关系、个人与组织的关系、组织与环境的关系以及组织与变化的关系,都完全改变了。随之而来的新范式必然也将逐渐融入组织行为学的经典框架,本教材不仅强调对基本概念和理论的准确把握,更突出对环境的分析,以及新环境影响下的组织行为、组织学习、组织网络的创新和价值。组织管理的核心价值,需要回归到组织赋能与激活人,以响应“现实”组织的特征。本教材不仅融入了大量实际案
    陈春花 曹洲涛 宋一晓 苏涛编著教材教辅38.3万字
  • 会员
    本书共分为三篇八章,每一篇章都涵盖了商业伦理与企业社会责任的不同方面,旨在为读者提供全面的理论和实践指导。第一篇是商业伦理与企业社会责任概述,其中,第1章主要是引领读者进入商业伦理与社会责任的世界,介绍了相关的概念和重要性,帮助读者建立一个全面的认知框架。第2章探讨相关理论和基础知识,为读者提供了深入了解商业伦理与企业社会责任的基础。第二篇聚焦于社会责任战略与伦理型组织变革,其中,第3章主要讨论社
    徐月华编著教材教辅10.6万字
  • 大学生拥有丰富的专业知识和敢于拼搏的勇气,只是苦于没有合理的职业规划,对自我认识不清晰,对职业世界一知半解,缺乏求职的技巧,因此不知道如何合理选择职业。本书为满足高校职业生涯规划课程的需要而编写,主要内容包括职业与职业生涯规划、知己知彼、生涯决策、制定职业生涯规划书、行动管理、心态调适、职业信息搜集、求职材料、求职面试、职业能力、职场礼仪、职业道德12个方面的内容。本书不仅可以作为大学生职业生涯规
    毋彩虹 岳军平 寇小妮主编教材教辅14.2万字
  • 会员
    本书以Hive为开发平台,主要介绍了如何使用HiveQL来查询和分析存储在Hadoop分布式文件系统上的大数据集合,具体内容包括Hive入门、Hive数据库及表操作、Hive元数据、Hive高级操作、Hive函数与Streaming、Hive视图与索引、Hive调优、Hive与HBase集成、数据迁移框架Sqoop等。本书介绍的每个任务都运用了大量案例,紧密结合实际应用,融入了含金量十足的开发经验
    肖睿 兰伟 廖春琼主编教材教辅8万字
  • 会员
    本书主要讲解Hadoop的分布式文件系统、MapReduce编程模型和Spark大数据处理技术。全书共12章,具体包括大数据概述、Hadoop大数据处理架构、HDFS分布式文件系统、MapReduce分布式计算框架、HBase分布式数据库、Spark概述、基于Scala的Spark编程、Windows环境下Spark综合编程、SparkSQL结构化数据处理、SparkStreaming流计算、
    曾国荪 曹洁编著教材教辅9.7万字
  • 会员
    《新编英国文学史教程》的编写针对现行同类教材语言生涩、内容繁杂的现状,以知识性和易读性为宗旨,以我国英语专业本科教学大纲为指导,充分考虑我国英语专业本科学生的英语语言实际水平,兼顾部分高校英国文学课程开设时间较短的现实,把握英国文学史整体框架,以文学发展不同时期为单位,把历史背景、文学运动、文学流派和作家作品的介绍凝练化、条理化,利于学生在有限的时间里构建一个比较系统完整的英国文学知识体系。同时,
    水彩琴主编教材教辅23.3万字
  • 全套教材共包括五个系列:科研公共学科主要围绕研究生科研中所需要的基本理论知识,以及从最初的科研设计到最终的论文发表的各个环节可能遇到的问题展开;实验技术与统计软件系列介绍了SAS统计软件、SPSS统计软件、分子生物学实验技术、免疫学实验技术等常用的统计软件以及实验技术;基础前沿与进展系列主要包括了基础学科中进展相对活跃的学科;临床基础与辅助学科系列包括了临床型研究生所需要进一步加强的相关学科内容;
    刘玉琴主编教材教辅34.3万字