搞定了从wordpress导入到blogger中的工作。
实验室貌似把机器弄down了,估计东西都没了。拜wp的插件所赐,我还有blog的备份(看了一下,整个2009-2010好像都没写……)。
wp到blogger的转换工具支持的是wp的导出文件,而非备份的sql文件,所以还需要搭建一个本地的wp站点。弄完了发现老是乱码,后来才发现,原来备份的sql文件中的数据库建立选择的编码是latin1!
改成utf8之后没有乱码了,但是查看post是一片空白,不管了,好歹export功能可以用,于是导出生出整个wp.xml文件。但是用google-blog-converters-appengine转换老是说sax解析有问题,而且异常指向的位置莫名其妙。后来用firefox查看,原来当初ip查询的日志中存在一些二进制字符(怪不得用dos2unix的时候提示是二进制文件,无法转换),于是对着firefox的错误显示一个改完,转换成功。再次鄙视一下python的sax,异常指示的行列绝对有问题。
然后将google-blog-converters-appengine的输出重定向到一个bg.xml文件中,然后在blogger中上传,结果说存在一个错误,失败。不解,分析一下bl.xml文件,发现前半部分和wp.xml完全一样,后半部分才是blogger的xml格式,看来是我在分析的时候多加了一句echo?
当然去掉之后就好了,导入成功。