Differential backup using 7-Zip for Windows (Part 2) - Secrets of batch files - 利用 7-Zip 進行差異備份(下篇) - 批次檔案的秘密

簡介

在上一篇文章 「Differential backup using 7-Zip for Windows (Part 1) - 利用 7-Zip 進行差異備份(上篇)」 中,介紹了如何利用 Open Source 軟體 7-Zip 壓縮程式,來進行差異備份。並使用 Windows/DOS 的 cmd batch 批次檔案,自動為備份檔名附加日期時間戳記。本文將繼續說明在撰寫 cmd batch 批次指令時,遇到的各種問題 (陷阱) 與解決方法。

Fork me on GitHub

架構

首先,以下是我慣用的批次檔檔案架構:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
@echo off
goto CONFIG

rem 批次檔使用與注意事項說明

:SYNTAX
echo Syntax: %~n0 [options] arguments
goto END

:CONFIG
set XXX=YYY
gogo START

:SUBROUTINES
goto :eof

:START

rem do something…
call :SUBROUTINES parameters

:END

簡單說明一下:

  • 一開始就跳到 :CONFIG 標籤區塊。在這裡進行偏好參數的設定。
  • 然後跳到 :START 標籤區塊,執行主程序。
  • 主程序在需要的時候,利用 call :LABEL 的方式,呼叫副程序。
  • :END 標籤通常是批次檔的結尾,有時候會在這個區塊設定批次檔的回傳值 (ERRORLEVEL)。
  • :START:END 之間,會盡量保持簡潔,凸顯批次檔的主要流程。

考慮需求

接下來,回顧一下我的備份需求:

  • 可以分類 (分開) 備份不同的目錄
  • 可以自動備份常用的目錄
  • 可以手動備份指定的目錄
  • 可以自動為備份檔案名稱,加上時間戳記
  • 可以指定進行完整備份或差異備份
  • 進行完整備份時,若已有當天的完整備份,則改進行差異備份
  • 進行差異備份時,若找不到完整備份,則改進行完整備份

以下,我們就依據需求,逐項來分析批次檔需要完成哪些工作。

需求:可以分類 (分開) 備份不同的目錄 + 可以自動備份常用的目錄

這就意味著,需要一個變數,用來保存需要備份的標的,以及一個 for 迴圈,來分別處理這些目錄。這個簡單:

1
2
3
4
5
set SRC_DIR=C:\folder1, C:\folder2, “C:\folder with space”

for %%F in (%SRC_DIR%) do (
echo %%F
)

輕鬆搞定。

需求:可以手動備份指定的目錄 + 可以指定進行完整備份或差異備份

這就意味著,需要解析命令列參數。為了提供較大的彈性,指定的備份來源目錄,應該允許一次指定多個目錄,所以這是一個數量可變動的參數,最好放在參數列的後方。至於允許手動指定進行完整備份或差異備份,這比較簡單,可以分別使用 FULLDIFF 參數來指定。不過,同樣為了提供彈性,應該提供預設值,讓使用者可以省略參數。

基於這樣的分析,我們的批次檔將提供如下的執行介面:

1
7z-bak [DIFF|FULL] [folders]
處理可選參數及變動參數

要提供上面的介面,我們將需要動態解析命令列參數。第一個版本,做了這樣的嘗試:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
if “FULL” == “%1“ (
set TYPE=FULL
shift
)
if “DIFF” == “%1“ (
set TYPE=DIFF
shift
)
if “” == “%TYPE%“ (
set TYPE=DIFF
)
set DIRS=%*
if NOT “” == “%DIRS%“ (
set SRC_DIR=%DIRS%
)

利用 shift 指令,可以「捲動」命令列參數,使原來的 %2 變成 %1%3 變成 %2,依此類推。這樣,我們就可以動態判斷第一個參數是否是 FULLDIFF,如果是的話,就將 TYPE 設定為對應的備份方式,並且將「其餘」的命令列參數,指定給 DIRS 變數,然後判斷 DIRS 變數如果不是空的,就用它來取代批次檔原來的預設值。

不幸的是,這樣是行不通的,原因在於 %* 這個參數列表示方式,它代表的是全部的命命列參數,而且,它不受 shift 指令的影響,永遠不會改變。所以利用 shift 是無法達成原來的目的:處理開頭可選的參數,並取得其餘的所有參數。

所以,我們必須自行遍歷所有的命令列參數,處理可選參數,並將其餘的參數,重新自行串接為一個字串,作為後續的處理。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
set PARAM=
for %%F in (%*) do (
if “FULL” == “%%F“ (
set TYPE=FULL
) else if “DIFF” == “%%F“ (
set TYPE=DIFF
) else (
if “” == “%PARAM%“ (
set PARAM=%%F
) else (
set PARAM=%PARAM%, %%F
)
)
)
echo TYPE=%TYPE%
echo PARAM=%PARAM%

再一次,我們又遇到不幸。原來,批次檔執行的時候,系統會一次解析「一整行」指令,像上面的 for 迴圈,雖然以多行的方式撰寫,但是系統實際上會將它一次讀入並進行解析。同時,為了「效率」,批次檔在解析 for 迴圈的階段,就對變數進行展開動作。由於 %PARAM% 變數為空值,所以上面程式碼,就被「展開」成這樣:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
set PARAM=
for %%F in (%*) do (
if “FULL” == “%%F“ (
set TYPE=FULL
) else if “DIFF” == “%%F“ (
set TYPE=DIFF
) else (
if “” == “” (
set PARAM=%%F
) else (
set PARAM=, %%F
)
)
)
echo TYPE=%TYPE%
echo PARAM=%PARAM%

看到了嗎,迴圈中的 %PARAM% 變數消失了,因為它被「展開」為空字串了。這樣一來,我們便無法在迴圈中對變數重複進行取值、設值的動作。

要避免這個問題,我們必須啟用「擴充功能」:delayed variable expansion,讓 for 迴圈中的變數,延遲到迴圈進行時,才被展開。這時候,在迴圈中引用變數時,要改用 !PARAM! 的寫法。要開啟 delayed variable expansion 擴充功能,可以使用 SETLOCAL 指令。下面是改寫後的迴圈:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
SETLOCAL enabledelayedexpansion
set PARAM=
for %%F in (%*) do (
if “FULL” == “%%F“ (
set TYPE=FULL
) else if “DIFF” == “%%F“ (
set TYPE=DIFF
) else (
if “” == “!PARAM!“ (
set PARAM=%%F
) else (
set PARAM=!PARAM!, %%F
)
)
)
echo TYPE=%TYPE%
echo PARAM=%PARAM%

哇!真是神奇,這麼簡單的迴圈功能,都可以弄得這麼複雜。不禁開始後悔為什麼要用批次檔來處理備份了。

改寫成 subroutine(副程序)

由於這段程式碼是用來處理命令列參數,如果能把它獨立為一個副程序,可以讓主程序的邏輯更加清楚。另一方面,批次檔使用的變數 (環境變數),實際上都是全域變數 – 批次檔結束後,依舊存在 – 至少對目前的 cmd 視窗而言。而 SETLOCAL 指令,實際上是要求 cmd 將變數當作區域變數使用,當批次檔結束或遇到對應的 ENDLOCAL 指令時,便會取消批次檔設定的變數,恢復到 SETLOCAL 之前的環境變數狀態。因此,SETLOCALENDLOCAL 指令,經常配對使用,尤其適合放在副程序中使用,可以避免變數名稱的衝突。所以,將上面的程式片段,改寫成以下的 :PARAMS 標籤區塊,作為副程序,供主程序呼叫:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
:PARAMS
SETLOCAL enabledelayedexpansion
set PARAM=
for %%F in (%*) do (
if “FULL” == “%%F“ (
set TYPE=FULL
) else if “DIFF” == “%%F“ (
set TYPE=DIFF
) else (
if “” == “!PARAM!“ (
set PARAM=%%F
) else (
set PARAM=!PARAM!, %%F
)
)
)
ENDLOCAL & setTYPE=%TYPE%“ & set “PARAM=%PARAM%
goto :eof

注意上面 SETLOCALENDLOCAL 指令配對的方式,以及 ENDLOCAL 指令利用 & 指令串接 set 指令,回傳變數的方式。由於需要設定兩個變數,所以需要使用另一個 & 指令串接第二個 set 指令。特別要注意的是,如果不像上面的範例一樣,使用 set "VAR=VALUE" 這樣的語法,將變數與值使用引號圍住,在第一個 set 指令後面,跟 & 指令之間不可以有空白,否則設定的變數 (在這個例子是 TYPE),會在後面多一個空白字元,導致後續判斷變數值時失敗。

呼叫 subroutine (副程序) 的方法

改寫成副程序之後,當然就要呼叫嘍。記得最前面提到,副程序其實是被轉成另一個批次檔來呼叫的嗎?既然實際上是另一個批次檔,它所接收到的參數,自然就不是原本的批次檔的參數了,所以主程序需要將副程序需要的參數,自行傳遞給副程序,副程序是無法看到主程序的 %* 參數的。另外,呼叫副程序時,不要忘了標籤前面的 : 號 (是的,跟 goto LABEL 的語法不一致):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
call :PARAMS %*

if NOT “” == “%PARAM%“ (
set SRC_DIR=%PARAM%
)
if “” == “%TYPE%“ (
set TYPE=DIFF
)
echo BAK_DIR=%BAK_DIR%
echo SRC_DIR=%SRC_DIR%
echo TYPE=%TYPE%

for %%F in (%SRC_DIR%) do (
call :%TYPE% %%F
)

呼叫 :PARAMS 副程序後,如果 %PARAM% 變數不是空的,我們就用它取代原本的 SRC_DIR 預設值。如果 %TYPE% 變數是空的,我們就設定 DIFF 做為預設的備份模式。把這些判斷放在主程序,以便凸顯預設值可以被命令列取代。

然後,修改一開始寫的 for 迴圈,逐一呼叫由 TYPE 變數所代表的對應備份副程序,並將備份來源目錄當作參數傳給副程序。

需求:可以自動為備份檔案名稱,加上時間戳記

考慮到完整備份通常會隔好幾天才執行一次,因此完整備份的檔案名稱的時間戳記,只需要日期就足夠了。而差異備份,通常會進行得比較頻繁,即使每個小時執行一次也不為過。因此差異備份的檔案名稱的時間戳記,除了日期之外,最好再加上時間,以免檔案名稱發生衝突。

基於這樣的考量,將檔案名稱格式設計成下面這樣:


完整備份
[備份目錄名稱]_YEARMMDD.7z

差異備份
[備份目錄名稱]_YEARMMDD_diff_yearmmdd_hhmmss.7z

要注意到 YEARMMDD 是完整備份的日期戳記。由於差異備份是基於完整備份,所以需要能夠清楚區分是基於哪一個完整備份,因此差異備份將使用完整備份的檔案名稱,再附加上實際備份的日期與時間戳記。所以上面的 YEARMMDDyearmmdd 很可能是不同日期。

決定了日期與時間戳記的格式,接下來就是設法取得正確的資料了。

雖然 %DATE%%TIME% 可以取得日期及時間,但是格式卻不適合做為檔案名稱。同時 %TIME% 並不會自動補零:

1
2
echo DATE=”%DATE%rem “2012/07/21 週六”
echo TIME=”%TIME%rem “ 2:08:04.09”

更糟糕的是,這跟系統使用的語系,以及使用者電腦的設定有關,每個系統的輸出可能不一致,很難正確重組格式。還好,找到了解決方案:How to get current datetime on windows command line, in a suitable format for using in a filename? 這篇問答提供了利用 wmic 指令取得 ISO 時間表示的方法。我直接改寫成以下的 :TIMESTAMP 副程序:

1
2
3
4
5
:TIMESTAMP
SETLOCAL
for /F “usebackq tokens=1,2 delims==” %%i in (wmic os get LocalDateTime /VALUE <span class="number">2</span>^&gt;<span class="built_in">NUL</span>) do if “.%%i.”==”.LocalDateTime.” set ldt=%%j
ENDLOCAL & setDATE=%ldt:~0,8%“ & setTIME=%ldt:~8,6%
goto :eof

這裡的 %ldt:~0,8%%ldt:~8,6% 寫法,是 substring 子字串處理的表示方式。第一個數字是由零起算的偏移位置,第二個可省略的數字是要擷取的長度。數字可以是負數,這時候就都代表由字串尾端往前計算的偏移位置。在這裡我們由 ldt 這個變數,分別取出日期與時間部分,設定給 DATETIME 變數。

上面的程式片段裡,有一個容易引起注意的地方是,在進入迴圈前,並未啟用擴充功能,這樣不會有問題嗎?

由於 ldt 變數在迴圈中只需要被「賦值」,並不需要同時執行「取值」與「賦值」的動作,也就是說,迴圈中不需要有 %ldt% 的引用,自然不會發生被展開為空字串的問題。所以上面的迴圈,可以省去啟用擴充功能的動作。

另一方面,若迴圈中只對變數進行「取值」,並不「賦值」,同樣也不需要啟用擴充功能。為什麼呢?讀者不妨自己想想看。

另外,使用 wmic 指令的缺點是,這是 Windows XP 之後才有的指令,而且執行時需要 Administrator 權限。如果不喜歡些限制,可以改用同一篇問答的另一個答案:Regionaly independent date time parsing,使用外部程式 date.exe 來輸出需要的格式。

要呼叫 :TIMESTAMP 副程序,可以這樣做:

1
2
3
4
5
call :TIMESTAMP

echo DATE=”%DATE%
echo TIME=”%TIME%
echo TIMESTAMP=”%DATE%_%TIME%

我們把這個呼叫放在主程序的 for 迴圈之前,以便初始化 DATETIME 變數,供後面的程式使用。另外,由於有許多副程序都需要啟用擴充功能,乾脆在主程序直接啟用吧:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
:START

SETLOCAL enabledelayedexpansion

call :PARAMS %*
if NOT “” == “%PARAM%“ (
set SRC_DIR=%PARAM%
)
if “” == “%TYPE%“ (
set TYPE=DIFF
)
echo BAK_DIR=%BAK_DIR%
echo SRC_DIR=%SRC_DIR%
echo TYPE=%TYPE%

call :TIMESTAMP
echo DATE: “%DATE%
echo TIME: “%TIME%

for %%F in (%SRC_DIR%) do (
call :%TYPE% %%F
)

:END

需求:進行完整備份時,若已有當天的完整備份,則改進行差異備份

當進行完整備份時,我們要能夠判斷當天的完整備份檔案是否已經存在,這個簡單,只要確認 [備份目錄名稱]_%DATE%.7z 檔案是否存在就成了。以下就是 :FULL 副程序:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
:FULL
SETLOCAL
set SRC=%1
set FN=%~nx1
echo ——————
echo Requesting full backup for%SRC%“…
set FB=%BAKDIR%\%FN%%DATE%.7z
if EXIST %FB% (
echo …full backup for%SRC%“: %FB% already exist, re-request diff backup instead…
call :DO_DIFF_BAK %SRC% %FB%
) else (
call :DO_FULL_BAK %SRC% %FB%
)
ENDLOCAL
goto :eof

:DO_FULL_BAK
goto :eof

:DO_DIFF_BAK
goto :eof

這個副程序接受一個參數,並將它儲存在 SRC 變數,這個參數代表要備份的目錄,格式是 D:\some_parent_dir\backup_dir.ext

另外,也同時將這個參數,只取出檔名的部分,儲存在 FN 變數,在這個例子,就是 backup_dir.ext。其中 ~n~x 表示方式,是取出路徑中的檔案名稱及副檔名,可以合併寫成 ~nx。由於路徑參數處理只能用於參數,無法用於 %VAR% 形式的字串變數,所以必須直接對 %1 進行操作,不能由 SRC 變數取得。

接下來,將 FB 變數設定為完整備份檔案的完整路徑名稱,然後檢查檔案是否存在。如果檔案存在,則呼叫 :DO_DIFF_BAK 改為進行差異備份;否則,則呼叫 :DO_FULL_BAK 繼續進行完整備份。呼叫副程序時,傳入要備份的目錄 %SRC%,以及完整備份檔案名稱 %FB% 作為參數:

1
2
3
4
5
6
set FB=%BAKDIR%\%FN%%DATE%.7z
if EXIST %FB% (
call :DO_DIFF_BAK %SRC% %FB%
) else (
call :DO_FULL_BAK %SRC% %FB%
)

需求:進行差異備份時,若找不到完整備份,則改進行完整備份

當進行差異備份時,我們要能夠找出最新的完整備份檔案,才能在該完整備份檔案的基礎上,進行差異備份。所以,這裡的問題是,要如何找到最新的完整備份檔案呢?

由於已經將完整備份檔案名稱固定為 [備份目錄名稱]_YEARMMDD.7z 這樣的格式,而 wildcard 通配字元 ? 只會匹配一個字元,所以利用 [備份目錄名稱]_????????.7z 這樣的格式,理論上應該能匹配檔案名稱只含有日期戳記 8 個數字的檔案,也就是只會批配完整備份檔案。同時,由於 for 迴圈在處理檔案匹配時,是依照檔案名稱排序,而我們的檔案名稱含有日期戳記,所以匹配的最後一個檔案,應該就是最新的完整備份檔案:

1
2
3
4
5
6
set SRC=%1
set FN=%~nx1
for %%F in (%BAKDIR%\%FN%????????.7z) do (
set FULL=%%F
)
echo “found: %FULL%

但是,很不幸地,實際上測試結果,它還是會批配到 [備份目錄名稱]_????????_diff_????????_??????.7z 的檔案,也就是找到差異備份檔案了。為什麼呢?原來通配字元會同時檢測「長檔名」與「短檔名」。我想,沒有經歷過 Windows 95/98/ME 的讀者,甚至於不知道什麼是「短檔名」吧?歐賣尬!

沒辦法,只好自己過濾了:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
:DIFF
SETLOCAL
set SRC=%1
set FN=%~nx1
echo ——————
echo Requesting diff backup for%SRC%“…
echo …finding full backup…
set FB=
for %%N in (%BAKDIR%\%FN%*.7z) do (
set STMP=%%N
set STMP=!STMP:~-11,8!
if%%N“ == “%BAKDIR%\%FN%!STMP!.7z” (
echo ……found: %%N
set FB=%%N
)
)
if “” == “%FB%“ (
echo …full backup not found, re-request full backup instead…
call :DO_FULL_BAK %SRC%%BAKDIR%\%FN%%DATE%.7z”
) else (
echo …full backup found: %FB%
call :DO_DIFF_BAK %SRC% %FB%
)
ENDLOCAL
goto :eof

利用擷取子字串的方式,擷取不含副檔名 (去掉 .7z) 的檔案名稱最後 8 個字元,並且重新依照完整備份的檔案名稱格式,重新拼湊出檔名。如果拼湊出來的檔案名稱與迴圈抓到的檔案名稱一致,就表示這個檔案確實是完整備份(差異備份檔案名稱最後 8 個字元應該是 8_888888 的格式,不會是 88888888 的格式),那麼,就記錄在 FB 變數。待迴圈執行完畢,就能得到最新的完整備份檔案名稱了。

然後,判斷如果 FB 為空字串,表示找不到任何完整備份檔,則呼叫 :DO_FULL_BAK,改進行完整備份;否則呼叫 :DO_DIFF_BAK,執行差異備份。呼叫副程序時,傳入要備份的目錄 %SRC%,以及完整備份檔案名稱 %BAK_DIR%\%FN%_%DATE%.7z%FB% 作為參數:

處理 7-Zip 壓縮共用選項

困難的部分差不多都處理完了…吧?在實際呼叫 7-Zip 執行壓縮之前,先設定一下壓縮的選項,以避免重複:

1
set 7Z_OPT=-scsUTF-8 -ssc -ssw -ms=on -mx=9 -t7z

唉!又踩到地雷了。變數名稱不能以數字開頭,否則會被當作命令列參數。是自己大意,摸摸鼻子就算了:

1
set Z_OPT=-scsUTF-8 -ssc -ssw -ms=on -mx=9 -t7z

下表一一說明這些選項的作用:

7-Zip 壓縮選項

選項 說明 預設值 備註
-scsUTF-8 檔名列表使用 UTF-8 編碼 預設開啟
-ssc 維持檔名大小寫 在 Windows 預設關閉 Java 開發者應該知道為什麼要打開這個選項
-ssw 壓縮被其它程式鎖住的檔案 預設關閉 自動執行備份的時候,很可能還有其他程式正打開要備份的檔案
-ms=on Solid Archive 把所有的檔案壓在一起,可以提高壓縮率 預設開啟
-mx=9 壓縮率設定為最大 預設為 5
-t7z 使用 7z 格式 預設由副檔名決定 只有 7z 格式支援差異備份

要特別說明的是,由於我們每次進行差異備份的時候,都將建立新的檔案,並不會更動到原有的壓縮檔,不會有需要耗時重新壓縮的問題,所以可以使用 -ms=on 選項,打開 Solid Archive 功能,提高壓縮率。-ms=on 選項是預設開啟的,不過把它寫出來,強調我們要啟用這個選項。

呼叫 7-Zip 執行完整備份

完整備份比較簡單,只要決定好檔案名稱及備份目錄,再以 a 命令呼叫 7za.exe 即可。

1
2
3
4
5
6
7
8
9
10
:DO_FULL_BAK
SETLOCAL
set DIR=%1
set FULL=%2
echo …performing full backup…
7za a %FULL% %Z_OPT% %DIR%
echo .
echo%FULL%…done.
ENDLOCAL
goto :eof

此副程序接受兩個參數,%1 是要備份的目錄,%2 是完整備份的檔案名稱。養成好習慣,把參數指定給比較容易辨識的變數名稱 DIRFULL,讓程式比較容易讀懂。

呼叫 7-Zip 執行差異備份

差異備份要使用 u 命令呼叫 7za.exe,為了要能忠實反映檔案的增刪異動情形,並且將異動情形儲存在獨立的差異備份檔案中,則要再加上 -u- -up0q3r2x2y2z0w2![差異備份檔案名稱] 選項:

1
2
3
4
5
6
7
8
9
10
11
:DO_DIFF_BAK
SETLOCAL
set DIR=%1
set FULL=%2
set DIFF=”%FULL:~0,-3%diff%DATE%_%TIME%.7z”
echo …performing diff backup on %FULL%
7za u %FULL% %Z_OPT% -u- -up0q3r2x2y2z0w2^^!%DIFF% %DIR%
echo .
echo%DIFF%…done^^!
ENDLOCAL
goto :eof

其中 -u- 選項,是告訴 7-Zip 不要更動 %FULL% 檔案。而 -up0q3r2x2y2z0w2!%DIFF% 是告訴 7-Zip 將異動的部分,放到 %DIFF% 檔案中。

如前面檔案名稱設計那一段所述,差異備份的檔案名稱,是使用對應的完整備份的檔案名稱,再附加上實際備份的日期與時間戳記,所以只要去掉 FULL 變數的 .7z 副檔名,再附加上 _diff_%DATE%_%TIME%.7z 就是差異備份的檔案名稱了。

等一下!那個兩個 ^^ 是什麼鬼!?

記得我們在主程序啟用了擴充功能嗎?現在就要為此付出代價了:

由於啟用擴充功能之後,變數須改用 !VAR! 的形式引用,這時候 ! 就有了特殊意義,因此若要讓 ! 被當作一般字元使用,就需要使用 ^^ 對它進行 escape 轉義!

初步的成果

把全部的程式碼整理在一起,下面就是可以處理備份功能的批次檔了:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
@echo off & goto CONFIG

:SYNTAX

echo Syntax: %~n0 [DIFF|FULL] [folders]
goto END

:CONFIG

set BAK_DIR=[你要儲存備份檔的目錄,不要包含路徑最後的 \ 字元]
set SRC_DIR=[你要備份的目錄,不要包含路徑最後的 \ 字元。用空格或逗號區隔不同目錄。如果目錄包含空白字元,請使用 “” 括住完整路目錄名稱]

set Z_OPT=-scsUTF-8 -ssc -ssw -ms=on -mx=9 -t7z

goto START

:PARAMS
SETLOCAL
set PARAM=
for %%F in (%) do (
if “FULL” == “%%F“ (
set TYPE=FULL
) else if “DIFF” == “%%F“ (
set TYPE=DIFF
) else (
if “” == “!PARAM!“ (
set PARAM=%%F
) else (
set PARAM=!PARAM!, %%F
)
)
)
ENDLOCAL & setTYPE=%TYPE%“ & set “PARAM=%PARAM%
goto :eof

:TIMESTAMP
SETLOCAL
for /F “usebackq tokens=1,2 delims==” %%i in (wmic os get LocalDateTime /VALUE <span class="number">2</span>^&gt;<span class="built_in">NUL</span>) do if “.%%i.”==”.LocalDateTime.” set ldt=%%j
ENDLOCAL & setDATE=%ldt:~0,8%“ & setTIME=%ldt:~8,6%
goto :eof

:DO_FULL_BAK
SETLOCAL
set DIR=%1
set FULL=%2
echo …performing full backup…
7za a %FULL% %Z_OPT% %DIR%
echo .
echo%FULL%…done^^!
ENDLOCAL
goto :eof

:DO_DIFF_BAK
SETLOCAL
set DIR=%1
set FULL=%2
set DIFF=”%FULL:~0,-3%diff%DATE%_%TIME%.7z”
echo …performing diff backup on %FULL%
7za u %FULL% %Z_OPT% -u- -up0q3r2x2y2z0w2^^!%DIFF% %DIR%
echo .
echo%DIFF%…done^^!
ENDLOCAL
goto :eof

:FULL
SETLOCAL
set SRC=%1
set FN=%~nx1
echo ——————
echo Requesting full backup for%SRC%“…
set FB=”%BAKDIR%\%FN%%DATE%.7z”
if EXIST %FB% (
echo …full backup for%SRC%“: %FB% already exist, re-request diff backup instead…
call :DO_DIFF_BAK %SRC% %FB%
) else (
call :DO_FULL_BAK %SRC% %FB%
)
ENDLOCAL
goto :eof

:DIFF
SETLOCAL
set SRC=%1
set FN=%~nx1
echo ——————
echo Requesting diff backup for%SRC%“…
echo …finding full backup…
set FB=
for %%N in (%BAKDIR%\%FN%.7z) do (
set STMP=%%N
set STMP=!STMP:~-11,8!
if%%N“ == “%BAKDIR%\%FN%!STMP!.7z” (
echo ……found: %%N
set FB=%%N
)
)
if “” == “%FB%“ (
echo …full backup not found, re-request full backup instead…
call :DO_FULL_BAK %SRC%%BAKDIR%\%FN%%DATE%.7z”
) else (
echo …full backup found: %FB%
call :DO_DIFF_BAK %SRC% %FB%
)
ENDLOCAL
goto :eof

:START

SETLOCAL enabledelayedexpansion

call :PARAMS %*
if NOT “” == “%PARAM%“ (
set SRC_DIR=%PARAM%
)
if “” == “%TYPE%“ (
set TYPE=DIFF
)
echo BAK_DIR=%BAK_DIR%
echo SRC_DIR=%SRC_DIR%
echo TYPE=%TYPE%

call :TIMESTAMP
echo DATE: “%DATE%
echo TIME: “%TIME%

for %%F in (%SRC_DIR%) do (
call :%TYPE% %%F
)

:END

處理目錄名稱含有空白的情形

記得上一篇文章的使用說明中提到,若目錄名稱含有空白字元,則要使用 "" 圍住嗎?我們這個批次程式能正確處理目錄名稱含有空白字元這種狀況嗎?

同樣非常不幸運地,答案是否定的。問題是出現在 :PARAMS 副程序:

1
2
if “FULL” == “%%F“ (
)

若在命令列輸入 7z-bak "C:\Program Files",則這段程式碼展開之後,會變成:

1
2
if “FULL” == “”C:\Program Files”” (
)

意外的是,若將目標目錄寫在批次檔中,像這樣: SRC_DIR="C:\Program Files",則不會發生錯誤,可以正常執行。

此外,還有個小瑕疵:即使檔名沒有空白字元,若我們強行加上 "" 號圍住,則在顯示備份訊息時,會出現 ""目錄名稱"" 這樣的內容。譬如若在命令列輸入 7z-bak "C:\temp",輸出訊息會是:

1
Requesting diff backup for “”C:\temp“”

雖然可以正常執行,但是真的…很奇怪耶!你!

要解決這些問題,我們需要在適當的時候,將檔案名稱以 "" 圍住,適當的時候,又需要將它展開,去除 ""

什麼時候需要圍住呢?在傳遞檔名時需要使用 "" 將檔名圍住,否則檔名將被拆開來解讀為兩個以上的參數。什麼時候需要展開呢?當我們需要重組檔名的時候,我們不希望檔名夾雜著多餘的或是不正確的 " 號,譬如 ""C:\Program Files""C:\"Program Files",在批次檔案裡面,就無法正確被解讀為檔案名稱。

要展開檔案名稱,可以使用前面提過的路徑參數處理語法,我們可以使用 ~f 指令展開完整路徑:

1
2
3
4
5
6
  set SRC_DIR=”C:\Program Files”, C:\”Program Files”, “”C:\Program Files””
for %%F in (%SRC_DIR%) do call :SUB %%F
goto :END
:SUB
echo %1 expands to: %~f1
:END

輸出:

1
2
3
4
“C:\Program Files” expands to: C:\Program Files
C:\“Program Files” expands to: C:\“Program Files”
“”C:\Program expands to: D:\scripts\”C:\Program
Files“” expands to: D:\scripts\Files“”

注意,後面兩個路徑名稱,都無法被 ~f 指令正確展開,第三個甚至連參數傳遞都不正確,被當作兩個參數傳遞了。

接下來,我們一一檢視哪些地方需要展開,哪些地方需要圍住:

主迴圈裡面呼叫副程序,備份目錄作為參數傳遞,所以不能在這裡展開,只要維持原樣:

1
2
3
for %%F in (%SRC_DIR%) do (
call :%TYPE% %%F
)

:FULL:DIFF 副程序,其中 SRC 接受參數之後,就不再更動,並且會被當作參數傳遞,所以可以直接在展開後立即圍住。而 FN 則需要做檔名重組,故只將它展開。FB 的狀況則與 SRC 類似,雖然在 :DIFF 中需要多次重新賦值:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
:FULL
SETLOCAL
set SRC=”%~f1”
set FN=%~nx1
echo ——————
echo Requesting full backup for %SRC%
set FB=”%BAKDIR%\%FN%%DATE%.7z”
if EXIST %FB% (
echo …full backup for %SRC%: %FB% already exist, re-request diff backup instead…
call :DO_DIFF_BAK %SRC% %FB%
) else (
call :DO_FULL_BAK %SRC% %FB%
)
ENDLOCAL
goto :eof

:DIFF
SETLOCAL
set SRC=”%~f1”
set FN=%~nx1
echo ——————
echo Requesting diff backup for %SRC%
echo …finding full backup…
set FB=
for %%N in (%BAKDIR%\%FN%*.7z) do (
set STMP=%%N
set STMP=!STMP:~-11,8!
if%%N“ == “%BAKDIR%\%FN%!STMP!.7z” (
echo ……found: “%%N
set FB=”%%N
)
)
if “” == “%FB%“ (
echo …full backup not found, re-request full backup instead…
set FB=”%BAKDIR%\%FN%%DATE%.7z”
call :DO_FULL_BAK %SRC% %FB%
) else (
echo …full backup found: %FB%
call :DO_DIFF_BAK %SRC% %FB%
)
ENDLOCAL
goto :eof

:DO_FULL_BAK 不需要更動,:DO_DIFF_BAK 則修正如下:

1
2
3
4
5
6
7
8
9
10
11
:DO_DIFF_BAK
SETLOCAL
set DIR=”%~f1”
set FULL=%~f2
set DIFF=”%FULL:~0,-3%diff%DATE%_%TIME%.7z”
echo …performing diff backup on “%FULL%“…
7za u “%FULL%%Z_OPT% -u- -up0q3r2x2y2z0w2^^!%DIFF% %DIR%
echo .
echo%DIFF%…done^^!
ENDLOCAL
goto :eof

完工

終於看到辛苦的成果,感動啊!

結論

之前對於批次檔的認識,一直停留在 DOS 3.X ~ 6.X 的時代,從來沒用過擴充功能。這次心血來潮,決定使用批次檔來呼叫 7-Zip 執行備份工作,說真的,實在是…自找罪受。Cmd 批次檔畢竟是 DOS 時代的遺物了,應該要跟上時代,改用 Windows PowerShell

不論如何,最終還是完成了,也算是學到了一點東西,趁忘記之前,趕緊寫下這篇長篇大論,以資紀念及備查。

歡迎大家的回饋與心得分享。

參考資料:

相關文章: