나는 메일을 거의 지우지 않는 편인데 지금까지 7년이 넘는 기간 동안 연구실 메일 서버를 통해서 주고 받은 메일을 거의 대부분 가지고 있다. 양이 엄청나기 때문에 연도별로 별도의 폴더에 넣고 보관을 한다. 한 해 동안의 메일은 적으면 1800건, 많으면 3000건 정도 된다. 그런데 그 동안 컴퓨터를 몇 번 바꾸기도 하였고 폴더 보관 방식을 바꾸기도 해서 thunderbird의 폴더 데이터에 거품이 많이 끼었다. 거품 청소를 해야 하는데 청소하기 전의 총 데이터양이 10GB 가까이 되었다. 청소하고 나니 약 7GB 정도로 줄었다. 3GB는 이익을 본 셈이다.
우선 사용한 기능들을 보면 Thunderbird 자체의 압축(compress가 아니라 compact이다.) 기능과 Remove Duplicate Messages (Alternate) 0.3.1이라는 Thunderbird add-on의 기능이다. 그리고 거품 청소를 해야겠다고 마음먹게 만든 글은 [Thunderbird] Uses LOTS of disk space - can't clean up이라는 글이다.
모든 폴더를 정리했는데 스크린샷을 남기기 위해 archive04라는 폴더를 정리하는 것을 보도록 한다.
일단 thunderbird가 저장하고 있는 공간을 보면 archive04에 1.2GB 정도를 사용하고 있다. 백업했다가 다시 데이터를 살리는 경우에 이미 지운 메일을 thunderbird가 다시 복구해버리는 경우가 있어서 중복된 메일들이 꽤 있다. 그래서 일단 중복된 메일을 지우는 작업을 한다.
폴더에 오른쪽 클릭을 하고 Remove Duplicates...를 선택하면 중복된 메일들을 검색한다. 이 기능은 앞에서 말한 add-on에서 제공하는 기능이다.
간혹 사람이 보기에는 중복된 메일을 그냥 두는 경우가 있는데 add-on의 설정에서 어느 속성들을 비교할 것인지를 변경해 보면 된다. 아마 message ID를 끄고 To와 CC 항목을 체크하는 것이 사람 눈으로 비교하는 것과 같은 효과를 가져올 것이다.
중복된 메일을 찾으면 그 중에서 어느것을 남길 것인지를 물어본다. 어차피 중복된 것이니 그냥 첫번째 copy를 남기기로 한다. 확인을 누르면 중복된 메일들을 지운 편지함으로 옮긴다.
다 끝나면 Thunderbird가 표시하는 메일 수는 줄었지만 실제 디스크 공간은 그대로일 것이다. 이제 압축을 한다.
여기서 압축이란 zip 같은 것을 쓰는 compression이 아니다. 앞에 링크한 글에도 나오지만 지운 메일은 실제로 디스크에서 지워지는 게 아니고 지웠다고 표시만 하고 데이터는 그대로 있다.
단지 Thunderbird가 표시하지 않을 뿐이다. 이런 방식은 한 폴더의 메일들을 전부 하나의 텍스트 파일에 저장하기 때문인데
이렇게 하는 것이 효율 면에서는 좋다. 그리고 메일 수가 많지 않고 빈번하게 접근하거나 다른 곳으로 데이터를 옮기거나 백업하거나
하는 것이 없다면 그냥 둬도 괜찮다. 큰 텍스트 파일에서 일부분을 지우거나 수정하는 것이 사실 만만치 않게 로드가 많이 걸리는
작업이다. 텍스트 에디터로 보면 어려울 게 없는 것 같지만, 글자 하나가 지워지거나 삽입되면 그 뒤에 있는 모든 글자의 위치가
변하기 때문에 이것을 모두 기록해야 한다. 뒤에 덧붙여 쓰는 작업 같은 것과는 비교가 안된다. Thunderbird에서 말하는 압축이란 지워졌다고 표시된 메일들을 실제로 디스크에서 없애는 작업이다. (
compact하게 만든다.) 폴더에 메일이 많으면 당연히 오래 걸린다. 인내심을 갖아야 한다.
압축까지 하고 나면 디스크 사용량이 많이 줄어든 것을 볼 수 있다.
폴더 하나에서 500메가 정도가 풀려났다.