구글애널리틱스


이글루스 백업 프로그램



1. 
파이썬 크롤러를 조금 공부 후 이글루스 백업 프로그램 제작을 시작했다. 
예전 같으면 이글루스 데이터를 퍼다가 어딘가 딴 곳에서 블로그를 새로 시작해야지... 하는 생각도 했었겠지만 
현재는 그런 생각은 없고 

다만 이글루스가 언제 망하고 데이터가 날아갈 지 몰라서 
어딘가 백업이라도 해둬야지 하는 생각이... 
java로는 몇 번 시도하다가 실패했고, 파이썬으로는 충분히 할 수 있겠다는 생각 들었음  

2. 
셀레니움 이용해 만들기 시작했다가, 깃헙에 누군가가 올려둔 egloos backup 프로그램이 생각났다. 
이걸 기반으로 만들기 시작함. 

대략 작동 원리 
- OAuth 로 이글루스 API에 접속 
- 포스팅 리스트를 읽어와서 json 파일로 저장하고 목록표로 활용 
- 포스트를 하나하나 넘겨가면서 열람/저장하는 기능 

여기까지는 원래 만들어져 있던 기능이고 내가 추가한 것이   
- OAuth 인증하기 귀찮아서, 자동로그인 구현 (셀레니움)   
- 목록표를 처음부터 현재파일까지 쭈-욱 읽으면서 포스팅 전체를 저장
- 커멘트 전체 저장  
- 저장한 json 파일에서, 날짜, 작성자, 제목, 내용 등 주요 사항만 HTML 파일로 변환해서 저장 

오늘 여기까지 만들고서 2010년정도까지의 자료를 열심히 백업 
그런데 비공개 포스팅은 읽어들이지 못하는 문제가 있다 (이글루스 API의 버그로 추정된다)

향후 만들고 싶은 기능 
- 비공개 포스팅 읽어들여서 저장하는 기능 
   -> 셀레니움으로 읽어오거나 또는 공개로 잠시 바꿔서 저장 후 비공개 전환? (후자가 좋은데, API 에 조금 문제가 있어보여서 작동하지 않을 듯)  
- 텍스트 포맷 정리하기 
- 이미지 파일 다운로드 받기 
- 서버 기반에서 작동하도록 수정 

근데 대충 여기까지 하고 나니 일차적인 목표가 달성되어서인지 더 하기가 귀찮다 -_ -

 

덧글

  • hansang 2019/05/26 21:33 # 답글

    오, 잘 되면 공유 부탁드립니다~연동 블로그에 자동 업로드가 되게끔 하는 기능이 생기면 좋겠네요...
  • 찬별 2019/05/29 19:41 #

    이글루스 운영진에게 적발되어 퇴출당하는 건 아닐까요 ㄷㄷㄷㄷ
댓글 입력 영역


google search

사용자 정의 검색

애드센스 세로

통계 위젯 (화이트)

121123
966
2509846