本书以MySQL数据库为研究对象,讨论与数据库索引相关的一些话题。特别需要说明的是,MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等。为了避免混乱,本文将只关注于BTree索引,因为这是平常使用MySQL时主要打交道的索引,至于哈希索引和全文索引本文暂不讨论。
文章主要内容分为三个部分。
第一部分主要从数据结构及算法理论层面讨论MySQL数据库索引的数理基础。
第二部分结合MySQL数据库中MyISAM和InnoDB数据存储引擎中索引的架构实现讨论聚集索引、非聚集索引及覆盖索引等话题。
第三部分根据上面的理论基础,讨论MySQL中高性能使用索引的策略。
文章主要内容分为三个部分。
第一部分主要从数据结构及算法理论层面讨论MySQL数据库索引的数理基础。
第二部分结合MySQL数据库中MyISAM和InnoDB数据存储引擎中索引的架构实现讨论聚集索引、非聚集索引及覆盖索引等话题。
第三部分根据上面的理论基础,讨论MySQL中高性能使用索引的策略。
2021年05月13日
TypeScript 是一种由微软开发的自由和开源的编程语言。它是 JavaScript 的一个超集,而且本质上向这个语言添加了可选的静态类型和基于类的面向对象编程。TypeScript 设计目标是开发大型应用,它可以编译成纯 JavaScript,编译出来的 JavaScript 可以运行在任何浏览器上。
2021年07月09日
MongoDB 是一个基于分布式文件存储的数据库。由 C++ 语言编写。旨在为 WEB 应用提供可扩展的高性能数据存储解决方案。
MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。
MongoDB 将数据存储为一个文档,数据结构由键值(key=>value)对组成。MongoDB 文档类似于 JSON 对象。字段值可以包含其他文档,数组及文档数组。
2021年09月14日 副本可以提供冗余并提高数据可用性。在不同数据库服务器上使用多个数据副本,可以提供一定程度的容错能力,以防止单个数据库服务器宕机时,数据丢失。
在某些情况下,副本还可以提供更大的读取吞吐量。因为客户端可以将读取操作发送到不同的服务器。在不同数据中心中维护数据副本可以提高数据本地性和分布式应用程序的可用性。您还可以维护其他副本以用于专用目的:例如灾难恢复,报告或备份。
在某些情况下,副本还可以提供更大的读取吞吐量。因为客户端可以将读取操作发送到不同的服务器。在不同数据中心中维护数据副本可以提高数据本地性和分布式应用程序的可用性。您还可以维护其他副本以用于专用目的:例如灾难恢复,报告或备份。
2021年09月14日
这是小白的零基础SQL教程。
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。也就是说,无论用什么编程语言(Java、Python、C++……)编写程序,只要涉及到操作关系数据库,比如,一个电商网站需要把用户和商品信息存入数据库,或者一个手机游戏需要把用户的道具、通关信息存入数据库,都必须通过SQL来完成。
所以,现代程序离不开关系数据库,要使用关系数据库就必须掌握SQL。
在本教程中,你将学到关系数据库的基本概念,如何使用SQL操作数据库,以及一种最流行的开源数据库MySQL的基本安装和使用方法。
廖雪峰,十年软件开发经验,业余产品经理,精通Java/Python/Ruby/Visual Basic/Objective C等,对开源框架有深入研究,著有《Spring 2.0核心技术与最佳实践》一书,多个业余开源项目托管在GitHub,欢迎微博交流:
什么是SQL?简单地说,SQL就是访问和处理关系数据库的计算机标准语言。也就是说,无论用什么编程语言(Java、Python、C++……)编写程序,只要涉及到操作关系数据库,比如,一个电商网站需要把用户和商品信息存入数据库,或者一个手机游戏需要把用户的道具、通关信息存入数据库,都必须通过SQL来完成。
所以,现代程序离不开关系数据库,要使用关系数据库就必须掌握SQL。
在本教程中,你将学到关系数据库的基本概念,如何使用SQL操作数据库,以及一种最流行的开源数据库MySQL的基本安装和使用方法。
廖雪峰,十年软件开发经验,业余产品经理,精通Java/Python/Ruby/Visual Basic/Objective C等,对开源框架有深入研究,著有《Spring 2.0核心技术与最佳实践》一书,多个业余开源项目托管在GitHub,欢迎微博交流:
2021年09月29日 在关系数据库中,如果有上万甚至上亿条记录,在查找记录的时候,想要获得非常快的速度,就需要使用索引。
原书地址:https://github.com/elastic/elasticsearch-definitive-guide
作者: clinton gormley,zachary tong
译者: Looly
参与翻译:
@iridiumcao
@cvvnx1
@conan007ai
@sailxjx
@wxlfight
@xieyunzi
@xdream86
@conan007ai
@williamzhao
@dingusxp
@birdroidcn
@MaggieHwang
感谢参与翻译的小伙伴们~~
邮箱: loolly@gmail.com
微博: @路小磊
作者: clinton gormley,zachary tong
译者: Looly
参与翻译:
@iridiumcao
@cvvnx1
@conan007ai
@sailxjx
@wxlfight
@xieyunzi
@xdream86
@conan007ai
@williamzhao
@dingusxp
@birdroidcn
@MaggieHwang
感谢参与翻译的小伙伴们~~
邮箱: loolly@gmail.com
微博: @路小磊
2021年10月04日
2021年10月04日
2021年10月04日
2021年10月04日
2021年10月04日
2021年10月04日
本教程共有十章,可分为三大模块:基础知识、四类操作、四类数据,涵盖了pandas的所有核心操作与特性。
在第一个模块中,包含了python基础、numpy基础和pandas基础三大部分。其中,python基础将回顾列表推导式、匿名函数、map对象以及zip对象的概念与应用;numpy基础包含了常见的数组操作,如:数组构造、数组变形与合并、数组切片、数组函数以及广播机制。pandas基础中涵盖了文件IO、数据存储结构、滑窗对象、以及pandas中的所有基本函数。
在第二个模块中,包含了索引、分组、变形、连接四类操作的介绍。其中,第三章索引涵盖了单层索引、多层索引、索引设定以及索引运算的内容;第四章分组介绍了分组对象的基本概念、聚合函数的使用、变换函数与过滤函数的用法,以及跨列分组的相关内容;第五章变形将讨论长宽表的变形、索引间的变形,以及类变形函数;第六章连接将涉及关系连接与方向连接的区别于使用方法,以及类变形函数的相关内容。
在第三个模块中,包含了缺失数据、文本数据、分类数据和时序数据的介绍。其中,第七章缺失数据将涉及其四大操作————汇总、删除、填充、插值,以及Nullable类型的详细介绍;第八章文本数据中将涵盖str对象,正则基础,文本的五大操作————拆分、合并、匹配、替换、提取,以及常用字符串函数;第九章分类数据将涉及cat对象、有序类别以及区间类别;第十章时序数据将涵盖时间戳对象、时间差对象、日期偏置、时序滑窗以及时序分组的内容。
每一个章节内部有三种特殊记号,分别是Warning、Note以及练一练,它们分别表示对于某个特性使用的警告、对于某个知识点的补充或者注释、针对上文所述内容的即时练习。此外,每个章节还配有相关的习题练习,以供读者巩固所学知识或引导读者进行深入的思考与总结。基于完整性,所有的章末练习作者都给出了参考答案。
在第一个模块中,包含了python基础、numpy基础和pandas基础三大部分。其中,python基础将回顾列表推导式、匿名函数、map对象以及zip对象的概念与应用;numpy基础包含了常见的数组操作,如:数组构造、数组变形与合并、数组切片、数组函数以及广播机制。pandas基础中涵盖了文件IO、数据存储结构、滑窗对象、以及pandas中的所有基本函数。
在第二个模块中,包含了索引、分组、变形、连接四类操作的介绍。其中,第三章索引涵盖了单层索引、多层索引、索引设定以及索引运算的内容;第四章分组介绍了分组对象的基本概念、聚合函数的使用、变换函数与过滤函数的用法,以及跨列分组的相关内容;第五章变形将讨论长宽表的变形、索引间的变形,以及类变形函数;第六章连接将涉及关系连接与方向连接的区别于使用方法,以及类变形函数的相关内容。
在第三个模块中,包含了缺失数据、文本数据、分类数据和时序数据的介绍。其中,第七章缺失数据将涉及其四大操作————汇总、删除、填充、插值,以及Nullable类型的详细介绍;第八章文本数据中将涵盖str对象,正则基础,文本的五大操作————拆分、合并、匹配、替换、提取,以及常用字符串函数;第九章分类数据将涉及cat对象、有序类别以及区间类别;第十章时序数据将涵盖时间戳对象、时间差对象、日期偏置、时序滑窗以及时序分组的内容。
每一个章节内部有三种特殊记号,分别是Warning、Note以及练一练,它们分别表示对于某个特性使用的警告、对于某个知识点的补充或者注释、针对上文所述内容的即时练习。此外,每个章节还配有相关的习题练习,以供读者巩固所学知识或引导读者进行深入的思考与总结。基于完整性,所有的章末练习作者都给出了参考答案。
2021年10月22日
2021年10月22日
2021年10月22日
2021年10月22日
2021年10月22日
2021年10月22日
本书面向初学者介绍了常用大数据框架的使用。
2021年11月17日 Hive 中的视图和 RDBMS 中视图的概念一致,都是一组数据的逻辑表示,本质上就是一条 SELECT 语句的结果集。视图是纯粹的逻辑对象,没有关联的存储 (Hive 3.0.0 引入的物化视图除外),当查询引用视图时,Hive 可以将视图的定义与查询结合起来,例如将查询中的过滤器推送到视图中。
多数软件开发人员并不是SQL专家,很多人对SQL的错误使用更使其效率低且难以维护。本书针对SQL使用中经常犯的错误展开分析,从数据库的逻辑设计、物理设计、查询设计、应用开发几个方面总结归纳各种典型错误,提出避免陷阱的方法。作为一本经验总结性的著作,本书是数据库编程人员不可或缺的手边书。你也会学到最新的全文搜索技术,设计出可以防范SQL注入的代码,掌握其他非常实用的使用技巧。
作者:Bill Karwin
作为软件工程师、咨询师和管理者,他在20年间开发并支持了各种各样的应用、程序库以及服务器,如PHP 5的Zend Framework, Interbase关系型数据库,以及Enhydra Java应用服务器等。他一直无私地分享他的专业知识,来帮助其他程序员提高效率、获得成功。他曾以各种方式回答了上千个关于SQL的疑问,其中不乏一些严重但又经常被忽略的问题。
本书适合SQL 数据库开发人员与管理人员阅读。
作者:Bill Karwin
作为软件工程师、咨询师和管理者,他在20年间开发并支持了各种各样的应用、程序库以及服务器,如PHP 5的Zend Framework, Interbase关系型数据库,以及Enhydra Java应用服务器等。他一直无私地分享他的专业知识,来帮助其他程序员提高效率、获得成功。他曾以各种方式回答了上千个关于SQL的疑问,其中不乏一些严重但又经常被忽略的问题。
本书适合SQL 数据库开发人员与管理人员阅读。
2021年12月04日 无论何时,在机器的帮助下找到结果,另一个问题就冒出来了——通过何种计算过程,能让机器最快地求出结果? -- 查尔斯•巴贝奇,《哲学家的生命历程》(1864)
一个处于萌芽阶段的知识库,用于持续分享自己的所见、所学、所思!
作者:heibaiying
博客:https://blog.csdn.net/m0_37809146
作者:heibaiying
博客:https://blog.csdn.net/m0_37809146
2021年12月07日 单字段索引、复合索引、多键索引、哈希所有、地理空间索引、文本索引;唯一索引、稀疏索引、部分索引、TTL 索引
前一页
后一页