ISBN/价格: | 978-7-111-52750-3:CNY99.00 |
---|---|
作品语种: | chi ger |
出版国别: | CN 110000 |
题名责任者项: | 基于R语言的自动数据收集/.(德) 西蒙·蒙策尔特 ... [等] 著/.吴今朝译 |
出版发行项: | 北京:,机械工业出版社:,2016 |
载体形态项: | xv, 366页:;+图:;+26cm |
丛编项: | 数据科学与工程技术丛书 |
提要文摘: | 本书共17章。第1章是概述,阐述数据挖掘的意义与实际应用。第2~8章介绍网络和数据技术基础知识。第9~11章介绍网络抓取和文本挖掘的实用工具箱。这一部分由三个核心章节组成:第9章讲解多种网络抓取技术,涉及正则表达式的使用、XPath、各类API接口、其他数据类型以及开源社区相关的技术;第10章深入介绍用于统计性文本处理的技术;第11章给出关于用R管理数据的项目中常见问题的一些见解。第12~17章介绍实际案例分析,涉及美国参议院里的合作网络、从半结构化文档解析信息、利用Twitter预测2014年奥斯卡奖、绘制姓氏地理分布图、采集关于手机的数据、分析产品评论里的情绪等。 |
题名主题: | R语言 程序设计 |
题名主题: | 数据收集 |
索书号: | TP312R/M39 |
中图分类: | TP312R |
中图分类: | TP311.13 |
个人名称等同: | 蒙策尔特 著 |
个人名称等同: | 鲁巴 著 |
个人名称等同: | 迈博纳 著 |
个人名称次要: | 吴今朝 译 |
记录来源: | CN 北京新华书店首都发行所有限公司 20160329 |