注冊 | 登錄讀書好,好讀書,讀好書!
讀書網(wǎng)-DuShu.com
當(dāng)前位置: 首頁出版圖書科學(xué)技術(shù)計(jì)算機(jī)/網(wǎng)絡(luò)軟件與程序設(shè)計(jì)程序設(shè)計(jì)綜合Hive編程(影印版)

Hive編程(影印版)

Hive編程(影印版)

定 價(jià):¥54.00

作 者: (美)卡普里奧羅(Edward Capriolo),(美)萬普勒(Dean Wampler),(美)盧森格林(Jason Rutberglen)著
出版社: 東南大學(xué)出版社
叢編項(xiàng):
標(biāo) 簽: 計(jì)算機(jī)/網(wǎng)絡(luò) 數(shù)據(jù)庫 數(shù)據(jù)庫理論

ISBN: 9787564141974 出版時(shí)間: 2013-05-01 包裝: 平裝
開本: 16開 頁數(shù): 328 字?jǐn)?shù):  

內(nèi)容簡介

  你是否需要把一個(gè)關(guān)系型數(shù)據(jù)庫應(yīng)用遷移到Hadoop上?卡普里奧羅等著的《Hive編程(影印版)》這本全面的指南將為你介紹Apache Hive,它是Hadoop的數(shù)據(jù)倉庫平臺(tái)。你將快速了解如何使用Hive的SQL方言——HiveQL——來匯總、查詢和分析存儲(chǔ)在Hadoop分布式文件系統(tǒng)中的大數(shù)據(jù)集?!禜ive編程(影印版)》為你展數(shù)據(jù)庫應(yīng)用于示了如何在你的環(huán)境中搭建和配置Hive,它也提供了對(duì)Hadoop和Map Reduce的概括介紹,并且演示了Hive是如何在Hadoop的生態(tài)系統(tǒng)中工作的。你還將在其中找到現(xiàn)實(shí)世界的實(shí)例分析,它們展示了那些使用Hive的公司是如何解決PB容量數(shù)據(jù)層面上的獨(dú)特問題。

作者簡介

  Edward CaPriolo,是Media6degrees的系統(tǒng)管理員,也是Apache軟件基金會(huì)的成員和Hadoop—Hive項(xiàng)目的委員之一。Dean Wampler,是Think Big Analytics公司的資深咨詢顧問,他專長于大數(shù)據(jù)問題以及諸如HadOOP這樣的工具和MachineLearning(機(jī)器學(xué)習(xí))。Jason Rutherglen,是Think Big Analytics公司的軟件架構(gòu)師,他專長于大數(shù)據(jù)、Hadoop、搜索和安全。

圖書目錄

Preface
1. Introduction
An Overview of Hadoop and MapReduce
Hive in the Hadoop Ecosystem
Pig
HBase
Cascading, Crunch, and Others
Java Versus Hive: The Word Count Algorithm
What's Next
2. Getting Started
Installing a Preconfigured Virtual Machine
Detailed Installation
Installing Java
Installing Hadoop
Local Mode, Pseudodistributed Mode, and Distributed Mode
Testing Hadoop
Installing Hive
What Is Inside Hive?
Starting Hive
Configuring Your Hadoop Environment
Local Mode Configuration
Distributed and Pseudodistributed Mode Configuration
Metastore Using JDBC
The Hive Command
Command Options
The Command-Line Interface
CLI Options
Variables and Properties
Hive "One Shot" Commands
Executing Hive Queries from Files
The .hiverc File
More on Using the Hive CLI
Command History
Shell Execution
Hadoop dfs Commands from Inside Hive
Comments in Hive Scripts
Query Column Headers
3. Data Types and File Formats
Primitive Data Types
Collection Data Types
Text File Encoding of Data Values
Schema on Read
4. HiveQL: Data Definition
Databases in Hive
Alter Database
Creating Tables
Managed Tables
External Tables
Partitioned, Managed Tables
External Partitioned Tables
Customizing Table Storage Formats
Dropping Tables
Alter Table
Renaming a Table
Adding, Modifying, and Dropping a Table Partition
Changing Columns
Adding Columns
Deleting or Replacing Columns
Alter Table Properties
Alter Storage Properties
Miscellaneous Alter Table Statements
5. HiveQt: Data Manipulation
Loading Data into Managed Tables
Inserting Data into Tables from Queries
Dynamic Partition Inserts
Creating Tables and Loading Them in One Query
Exporting Data
……
6.HiveQL: Queries
7.HiveQL: Views
8.HiveQL: Indexes
9.Schema Design
10.Tuning
11.Other File Formats and Compression
12.Developing
13.Functions
14.Streaming
15.Customizing Hive File and Record Formats
16.Hive Thrift Service
17.Storage Handlers and NoSQL
18.Security
19.Locking
20.Hive Integration with Oozie
21.Hive and Amazon Web Services(AWS)
22.HCatalog
23.Case Studies
Glossary
Appendix:References
Index

本目錄推薦

掃描二維碼
Copyright ? 讀書網(wǎng) m.ranfinancial.com 2005-2020, All Rights Reserved.
鄂ICP備15019699號(hào) 鄂公網(wǎng)安備 42010302001612號(hào)