网络数据采集技术:Java网络爬虫实战在线阅读
会员

网络数据采集技术:Java网络爬虫实战

钱洋等
开会员,本书免费读 >

计算机网络编程语言与程序设计6.1万字

更新时间:2020-09-29 15:50:25 最新章节:9.4 本章小结

立即阅读
加书架
下载
听书

书籍简介

本书以Java为开发语言,系统地介绍了网络爬虫的理论知识和基础工具,包括网络爬虫涉及的Java基础知识、HTTP协议基础与网络抓包、网页内容获取、网页内容解析和网络爬虫数据存储等。本书选取典型网站,采用案例讲解的方式介绍网络爬虫中涉及的问题,以增强读者的动手实践能力。同时,本书还介绍了3种Java网络爬虫开源框架,即Crawler4j、WebCollector和WebMagic。本书适用于Java网络爬虫开发的初学者和进阶者;也可作为网络爬虫课程教学的参考书,供高等院校文本挖掘、自然语言处理、大数据商务分析等相关学科的本科生和研究生参考使用;也可供企业网络爬虫开发人员参考使用。
上架时间:2020-01-01 00:00:00
出版社:电子工业出版社
上海阅文信息技术有限公司已经获得合法授权,并进行制作发行

最新章节

钱洋等
主页

同类热门书

最新上架

  • 会员
    《小学生Python创意编程:视频教学版》语言风趣幽默,讲解细致入微,案例生动有趣,能够让小朋友轻松愉悦地学习Python编程。《小学生Python创意编程:视频教学版》共分14章,以图解的形式介绍变量、条件判断、循环、列表、函数、类与对象、模块、文件、注释、异常与调试等基础知识,简单明了,易于理解;穿插许多小朋友感兴趣的项目案例,如输出爱心、绘制五角星、诗词接龙、探索运算、侦测破案、商品管理系统
    刘凤飞计算机5.9万字
  • 会员
    本书为适应新工科复合型人才对计算思维和问题求解能力的要求而编写。全书共12章,主要内容包括:计算思维与问题求解,数据类型、运算符和表达式,简单的C程序设计,选择结构程序设计,循环结构程序设计,函数,数组,常用算法,指针,结构体,文件系统和人工智能经典算法。本教材兼顾计算思维与程序设计基础知识,注重问题抽象,通过问题案例分析,逐步给出问题求解算法与程序实现,引导读者的算法思维和程序设计思维。通过“常
    刘杰 鞠成东 郭江鸿主编计算机13.2万字
  • 会员
    本书是一本难度适当、易学易懂的小学生Python启蒙教材,用贴近孩子的语言,通过多个简单、有趣的编程案例,激发孩子学习和探索科技的兴趣。本书以程序为中心,适当弱化语法。本书共11章,涵盖Python输入输出、数据类型、选择循环基本结构、函数、面向对象编程、海龟绘图、二进制和GUI编程等,内容丰富全面,每章末尾配有单词表和思考题,帮助读者巩固所学知识和技能。本书适合任何想要通过Python学习编程的
    曹阳波 李文月编著计算机4.2万字
  • 会员
    本书以实用的设计模式为例,讲解了Java近年来在改善语法方面取得的进展,同时在实现这些模式的过程中展示了语言特性、设计模式与平台效率之间的关系。本书涵盖23种传统的设计模式、11种较为常见的模式,以及8种适用于多线程环境的并发模式。另外,本书还简要介绍了15种反模式。作者讲解这些模式的时候不仅给出了简洁、直观的范例代码,而且还利用UML类图与JFR工具展示了运用该模式的程序所具备的架构及运行细节,
    (美)米罗斯拉夫·威格纳计算机11.6万字
  • 会员
    《HTML5从入门到精通(第4版)》从初学者角度出发,通过通俗易懂的语言、丰富多彩的实例,详尽地讲解了与HTML5开发相关的知识。全书分为3篇,共22章,包括HTML简介、HTML5基础、设计网页文本内容、使用列表、超链接、使用图像、表格的应用、布局标签、全局属性、编辑表单、嵌入多媒体元素、文件操作、拖放操作、绘制图形、SVG的使用、数据存储、使用WebWorkers处理线程、HTML5消息通信
    明日科技编著计算机17.3万字
  • 会员
    本书是一部系统讲述Python编程语言与编程方法的案例化教程。全书共分为9章:第1章为Python编程基础知识;第2章为组合数据类型及使用;第3章为函数及调用规则;第4章为程序设计;第5章为面向对象程序设计方法;第6章为文件操作与异常处理;第7章为Python的GUI设计;第8章为Python绘图方法;第9章为Python网络爬虫。每章都设置了大量应用案例跟踪指导。本书可作为高等学校Python程
    姜增如编著计算机6.5万字
  • 会员
    《Python数据可视化之Matplotlib与Pyecharts实战》以某上市电商企业的客户数据、订单数据、股价数据为基础,循序渐进地介绍Python可视化技术,重点介绍Pandas数据预处理与Matplotlib和Pyecharts在数据可视化应用中的基本功能和使用技巧。全书共分4篇,第1篇(第1~4章)主要介绍Python基础与Pandas数据预处理技术,帮助准备可视化数据;第2篇(第5~7
    王国平编著计算机7.4万字
  • 会员
    本书是一本C#10的技术指南,在上一版的基础上进行了全面更新,围绕概念和用例进行组织,系统、全面、细致地讲解了C#10从基础知识到各种高级特性的命令、语法和用法。本书首先介绍C#和.NET,第2—4章详细介绍C#语言的语法、类型和变量。其余各章则涵盖.NET6基础类库的功能,包括LINQ、XML、集合、并发、I/O和联网、内存管理、反射、动态编程、属性、加密和原生互操作性等主题。第5章和第6
    (澳)约瑟夫·阿坝哈瑞计算机38.2万字
  • 会员
    《深入浅出Go语言核心编程》是一本全面而深入的Go语言学习手册,涵盖了Go语言的诸多关键特性,包括语法结构、内存原理、并发、上下文机制与框架应用等。本书共20章。第1章引导读者快速搭建开发环境,详细介绍Go语言的环境配置及编译运行的具体细节。第2~5章详细讨论Go语言独特的变量、常量、常用数据类型和流程控制,并重点解析复杂类型的底层实现机制。第6~8章讲解Go语言的函数及如何实现面向对象编程,打通
    张朝明 李奕锋 甘海彬计算机19.8万字

同类书籍最近更新

  • 会员
    本书从实际出发,通过典型案例系统地介绍了软件测试的流程和相应的测试技术。其中,第1、2章的主要内容是软件测试的起源及发展、现状及前景,以及软件测试的定义、分类、标准等;第3章、第4章的主要内容是软件测试的重点与难点分析、常见测试类型、测试策略与方法、常见软件问题等;第5章主要讲述的是软件测试5个典型阶段的工作要点;第6章的主要内容是测试过程管理的配置管理、质量监督和成果评审;第7章的主要内容是测试
    高炽扬主编程序设计12.8万字
  • 会员
    本书针对当前各大IT企业面试笔试中特性与侧重点,精心挑选了三年来近百家IT企业的面试笔试真题。这些企业涉及业务包括系统软件、搜索引擎、电子商务、手机APP、安全关键软件等,所提供的面试笔试真题非常具有代表性与参考性。同时,本书对这些题目进行了合理的划分与归类,并且对其进行了庖丁解牛式的分析与讲解,针对试题中涉及的部分重难点问题,本书都进行了适当地扩展与延伸,力求对知识点的讲解清晰而不紊乱,全面而不
    猿媛之家编著程序设计19.9万字
  • 会员
    《Android从入门到项目实践:超值版》采取“基础知识→核心应用→核心技术→高级应用→项目实践”结构和“由浅入深,由深到精”的学习模式进行讲解。《Android从入门到项目实践:超值版》分为5篇共20章。首先讲解了Android的基础入门、AndroidStudio的使用、Android开发和面向对象与Android布局等基础知识,还深入学习了Android基本控件、Android高级控件、活动
    聚慕课教育研发中心程序设计12.2万字
  • 会员
    《PHP程序员面试笔试真题与解析》针对当前各大IT企业面试笔试中特性与侧重点,精心挑选了三年来近百家IT大厂的PHP面试笔试真题。这些企业涉及业务包括系统软件、搜索引擎、电子商务、手机APP、安全关键软件等,所提供的PHP面试笔试真题非常具有代表性与参考性。同时,本书对这些题目进行了合理的划分与归类,并且对其进行了庖丁解牛式的分析与讲解,针对试题中涉及的部分重难点问题,《PHP程序员面试笔试真题与
    猿媛之家组编 琉忆 楚秦等编著程序设计13.9万字
  • 会员
    本书从Python最基础的知识开始,主要聚焦于数据结构,接着快速转至数据整理的基本工具NumPy和pandas库。我们着重讲述为什么应该放弃用其他语言实现的传统方法,而采用Python中预先构建程序的方法实现数据清理。之后,你将了解如何使用相同的Python后端,从各种不同的数据源(如Internet、大型数据库或Excel财务表)中提取和转换数据。然后,你还将学习如何根据下游的分析工具需求,处理
    (美)提尔塔吉奥蒂·萨卡 (印)舒布哈迪普·罗伊乔杜里程序设计9.2万字
  • 会员
    本书以结构化的方式,从基本层面上阐述了DevOps的全貌,可以帮助读者了解新的领域发展趋势,洞悉下一步发展契机。书中介绍了DevOps的起源、发展的必然性、关键前提条件及其在实践中的应用效果与原理。
    (俄)奥列格·斯克伦尼科程序设计10万字