• gitee 爆仓 处理流程


    Git 并不适合管理二进制文件,但有些情况下又不得不添加一些图片之类的二进制文件,但一旦频繁更改的话,历史记录中将记录着每一个完整的二进制文件,导致 repo 越来越大……为了解决该问题,往往需要一些针对二进制文件的处理手段

    定期清理 Git 历史

    定期清理的话,虽然麻烦,但也最实用,在使用 LFS 之前我也定期清理过,是使用的 git-filter-branch,但由于嫌麻烦,就改用 LFS 了,至于为什么不用 BFG,因为懒得装 JDK

    弃用 LFS 后,我仍然使用 git-filter-branch,不过实在是麻烦,每次清理我需要运行好多命令,比如清理全部 *.jpg 图片,我需要

    git filter-branch --force --index-filter 
    'git rm --cached --ignore-unmatch -r *.jpg' 
    --prune-empty --tag-name-filter cat -- --all
    rm -rf .git/refs/original/
    git reflog expire --expire=now --all
    git gc --prune=now
    git gc --aggressive --prune=now
    git push origin master --force

    emmm,就很麻烦

    最近,使用 git filter-branch 会提示 warning,推荐使用 git filter-repo,于是就试着搜了下,这居然是 python 实现的清理器,拥有远比 git filter-branch 更加方便的使用方法,所以我在尝试了一下下就果断转 git filter-repo 了

    在使用之前需要先使用 pip 安装一下

    pip3 install git-filter-repo
    
    1

    使用 git filter-repo 清理全部 *.jpg 只需要

    git filter-repo --path-glob '*.jpg' --invert-paths
    
    1

    不仅命令简单,而且速度超快,只不过不能像 git filter-branch 一样清楚地了解都清理了哪些文件了

    TIP

    如果你不知道哪些历史文件比较大的话,可以运行下面这个命令来查找一下

    git rev-list --objects --all | grep "$(git verify-pack -v .git/objects/pack/*.idx | sort -k 3 -n | tail -5 | awk '{print$1}')"
    
    当然,这只是 git filter-repo 的一个最简单的应用啦,更多使用技巧还是要看文档的~


    定期清理历史记录的方案:

    --
    git filter-branch --force --index-filter 'git rm --cached --ignore-unmatch -r *.jpg' --prune-empty --tag-name-filter cat -- --all rm -rf .git/refs/original/ git reflog expire --expire=now --all git gc --prune=now git gc --aggressive --prune=now git push origin master --force





    https://nyakku.moe/posts/2020/06/12/use-git-filter-repo-clean-git-history.html
  • 相关阅读:
    Combination Sum
    Partition List
    Binary Tree Zigzag Level Order Traversal
    Unique Binary Search Trees II
    Count and Say
    Triangle
    3Sum Closest
    Search for a Range
    Longest Common Prefix
    Convert Sorted List to Binary Search Tree
  • 原文地址:https://www.cnblogs.com/porter/p/14228461.html
Copyright © 2020-2023  润新知