Git与SVN的区别

最近在忙着找工作准备面试,正好想起之前还没填的一个坑。之前做开发的表哥问我Git和SVN有什么区别,结果一下把我问住了。于是我决心好好去把这个问题搞搞清楚,然而中间由于各种原因一直拖到了现在。那么,我想在这篇博文里详细就这个问题进行一下总结,重点会放在它们在概念上的不同。

首先把Git跟SVN的显著区别列一下:

  1. Git是分布式的,SVN是非分布式的。
  2. Git把内容按元数据方式存储,而SVN是按文件。
  3. Git分支和SVN的分支不同。
  4. Git没有一个全局的版本号,而SVN有。
  5. Git的内容完整性要优于SVN。

先来看看第一点。与SVN一样,Git有自己的集中式版本库或服务器。但是一个明显的不同时,Git在被使用时一般是以分布式模式运行。一个典型的例子就是开发者使用git clone <repoURL>将位于中心版本库/服务器上的代码在被check out后复制到本地,从而达到在本地建立一个自己的版本库的目的。

这种做法带来的一个最明显的好处就是,当开发者处于一个脱离网络连接的环境时,该开发者仍然可以对代码库进行操作,像是提交更改、查看历史版本记录、创建项目分支等等。

下面再来看第二点。在Git中,所有关于项目文件的引用都存储在.git文件夹内,包括标签、分支、版本历史记录等等。而在分支相同的情况下,例如都是master分支的话,则代码库里的文件内容保持不变。而在SVN里,代码库文件夹中包含主干以及所有分支的相关文件,.svn文件夹仅仅保存这些文件的元信息。

接下来看第三点。在一个Git的代码库文件夹中,文件内容会随着所在分支的不同而发生变化。当开发者在某一分支下开发完成某些功能后,使用git merge命令可以将该分支与master分支合并。再将当前分支切换为master后,该目录下的文件内容就会自动切换为当前master分支下的文件。与此同时,合并后之前用于开发新功能的分支就会自动被删除。而对于一个SVN代码库来说就不太一样了。

以上三点涉及到Git和SVN在设计思路上的不同,也就是概念的区别。下面的不同则可以视为各家特性上的不同。

再接下来看第四点。在SVN中,版本号的作用就相当于给任一相应时间点时代码库内的文件进行了一次快照。而由于Git的机制与SVN不同,因此并不存在全局版本号这一概念。在Git中最为类似的特性是通过SHA-1哈希函数来对当前代码库进行快照,然而该特性并不能被视为与SVN中的全局版本号等同。

最后看第五点。Git通过使用SHA-1哈希算法来确保内容存储的完整性,减少了代码库在遇到磁盘存储故障或者网络传输问题时出现文件内容不一致的风险。更详细的讨论参见stackoverflow

以上就是我想总结的一些关于Git和SVN这两种版本管理系统的差异。这里仅仅列举了它们的一些明显的不同点,相信还有不少相对不太起眼的差别,今后还会陆续总结。

引用来源: GitHub - What are the differences between Subversion and Git? 外刊IT评论 - GIT和SVN之间的五个基本区别