大家好,我是二哥呀!
从今天开始,我计划在《Java 程序员进阶之路》专栏的“Java 企业级开发”子目录中分享几篇关于 git 的文章。由于公众号文章发布后无法修改或添加统一目录作为索引页,我决定将《Java 程序员进阶之路》的系列文章开源到 github 上。
目前计划的主题包括:
- Git 的前世今生(本文)
- Git 的数据结构
- Git 的内部实现
- 常用 Git 命令清单
- Git 的基本使用
- Git 分支管理
- Git 版本库托管商 GitHub
- Git 学习资料推荐
如果大家有喜欢的主题,也欢迎在评论区提出。好了,我们开始吧。
Git 是一个分布式版本控制系统,由著名的林纳斯·托瓦兹(Linus Torvalds)创建。Git 最初的目的是为了更好地管理 linux 内核源码。
众所周知,Linux 内核是开源的,参与者众多,至今已有两万多名开发者为 Linux Kernel 贡献过代码。然而,从 1991 年到 2002 年期间,Linus 作为项目管理员并没有使用任何配置管理工具,而是通过手动合并大家提交的补丁来管理代码。
这并不是因为 Linus 喜欢手动处理,而是因为他对代码版本管理工具非常挑剔,无论是商用的 ClearCase,还是开源的 CVS、svn,都不符合他的要求。
直到 2002 年,Linus 才看中了一款分布式版本控制系统 BitKeeper。尽管 BitKeeper 是商用的,但它愿意让 Linux 社区免费使用,这让 Linus 非常高兴和满意。
然而,到了 2005 年,由于 BitKeeper 提供的默认接口无法满足 Linux 社区用户的所有需求,一位开发者在未经许可的情况下反编译了 BitKeeper 并使用了未公开的接口。于是,BitKeeper 的著作权拥有者拉里·麦沃伊愤怒地收回了 Linux 社区的免费使用权。
无奈之下,Linus 决定自己动手。他为新的版本控制系统设定了几个目标:
- 速度快
- 设计简单
- 允许成千上万个并行开发分支
- 完全分布式
- 能够高效管理类似 Linux 内核的超大规模项目
令人惊讶的是,Linus 仅用了 10 天时间就用 C 语言完成了第一个版本,真是神一般的速度。他给这个版本起了一个略带嘲讽意味的名字——Git(在英式英语俚语中表示“不愉快的人”)。
Git 的设计包括两种命令:底层命令(Plumbing commands)和高层命令(Porcelain commands)。最初,Linus 设计了一些符合 unix KISS 原则的命令,供开源社区的黑客们使用,因为这些黑客本身就是动手高手,所以这些命令被称为 plumbing commands。
Linus 在提交了第一个 git commit 后,向社区发布了 git 工具。当时,社区中一位名叫 Junio Hamano 的开发者对这个工具产生了兴趣。他下载了代码,发现只有 1244 行,这更激发了他的兴趣。Junio 通过邮件列表与 Linus 交流,并帮助增加了 merge 等功能,后来持续打磨 git,最终完全接手了 Git 的维护工作,而 Linus 则回到了 Linux Kernel 项目的维护工作上。
Junio Hamano 认为 Linus 设计的这些命令对普通用户不太友好,因此在此基础上封装了更易于使用、接口更友好的高层命令,这就是我们今天常用的 git add、git commit 等命令。例如,git add 封装了 update-cache 命令,而 git commit 封装了 write-tree、commit-tree 命令。
如果要选历史上最伟大的一次 Git 代码提交,那一定是 Git 工具项目本身的第一次代码提交。这次提交无疑是开创性的。如果说 Linux 项目促成了开源软件的成功并改变了软件行业的格局,那么 Git 则改变了全世界开发者的工作方式和写作方式。
如今,Git 已经成为全球软件开发者的标配。
最初的 Git 仅适用于 Unix/Linux 平台,但随着 Cygwin、msysGit 环境的成熟,以及 TortoiseGit 等易用的 GUI 工具的出现,Git 在 windows 平台上也逐渐成熟。
Git 和传统的版本控制工具 CVS、SVN 有着显著的区别,前者关注文件的整体性是否发生了变化,而后两者更关注文件内容的差异。
Git 存储项目随时间改变的快照。
此外,Git 更像是一个文件系统,每个使用它的主机都可以作为版本库,并且可以在不依赖远程仓库的情况下离线工作。开发者在本地就有历史版本的副本,因此不再受限于远程仓库的网络传输。
Git 的大多数操作只需要访问本地文件和资源,通常不需要来自网络上其他计算机的信息。因为在本地磁盘上就有项目的完整历史,所以 Git 的大部分操作看起来就像是瞬间完成的。
在多人协作的情况下,Git 可以将本地仓库复制给其他开发者,那些发生变化的文件可以作为新的分支导入,再与本地仓库进行分支合并。
为了后续学习更顺利,请记住 Git 的三种状态:
- 已提交(committed):表示数据已经安全地保存在本地数据库中。
- 已修改(modified):表示修改了文件,但还没保存到数据库中。
- 已暂存(staged):表示对一个已修改文件的当前版本做了标记,使之包含在下次提交的快照中。
由此引入了 Git 的三个工作区域:
- Git 仓库:用来保存项目的元数据和对象数据库。
- 工作目录:对项目的某个版本进行独立提取。
- 暂存区域:保存了下次将提交的文件列表信息,也可以称为“索引”。
Git 的工作流程如下:
- 在工作目录中修改文件。
- 暂存文件,将文件的快照放入暂存区域。
- 提交更新,找到暂存区域的文件,将快照永久性存储到 Git 仓库目录。
接下来,我们来看一下 Git 的安装。Linux 和 Windows 系统的安装方法可以在 Git 官网上找到,非常详细。
我个人使用的是 macos 系统,可以直接使用 brew install git 命令进行安装,非常方便。
安装成功后,使用 git –version 就可以查看版本号了,我本机上安装的是 2.23.0 版本。
参考资料: