第一次來到 Hexo !

1. 序
1. 1.1. 失敗就是失敗
2. 這是一個搬運的過程，但是宣告失敗
1. 2.1. 初章
2. 2.2. 次章

序

失敗就是失敗

看著右上方的清單，還真有 wiki 的感覺，對於長篇大論是挺有用的，現在應該說是裝飾，接下來要描述失敗的開始。

這是一個搬運的過程，但是宣告失敗

初章

為了轉移過來，將 Morris’ blog(PChome) 文章倚靠爬蟲方式轉移過來，但是沒想到這裏要的是 markdown 檔案格式，用 Nodejs 寫了巨噁無比的代碼來專屬爬 PChome 新聞台，並且使用套件將其轉換成 markdown。

最後宣告失敗。

用了不少可以將 html to markdown 的工具，或者只是單純要 html to text，但是不管哪個產出的格式都不好，心灰意冷的情況下，開始動工修改 node_modules 資料夾下的插件代碼，track 相異插件各種作噁，最後還是沒成功。

次章

目前以玩玩的心態架設這個靜態頁面。

附上 20140411 BACKUP Morris’ blog(PChome) backup

nodejslink

var http =  require('http'),
    fs = require('fs');
var toMarkdown = require('to-markdown').toMarkdown;
var htmlToText = require('html-to-text');
/*
var text = htmlToText.fromString('<h1>Hello World</h1>', {
    wordwrap: 130
});*/
// console.log(toMarkdown('<b>Hello world</b>'));
var websiteName = "zerojudge";
var websitePage = 141;
var websiteDomain = 'http://mypaper.pchome.com.tw/';
var url = websiteDomain + websiteName;
var loadprocess = 0;
clawingWebSite(url, websitePage);
function clawingWebSite(url, websitePage) {
    for(var i = 0; i <= websitePage; i++) {
        if(i == 0)
            clawingWebPage(url);
        else
            clawingWebPage(url + "/P" + i);
    }
}
function clawingWebPage(url) {
    readWebPage(url);
}
function branchWebPage(source) {
    var sourceIndex = source.indexOf('class="blog"');
    while(sourceIndex >= 0) {
        var pageLink = source.indexOf(websiteName + '/post', sourceIndex);
        if(pageLink > 0) {
            var endLink = source.indexOf('"', pageLink);
            var articleLink = source.substr(pageLink, endLink - pageLink);
            readWebArticleLink(websiteDomain + articleLink, articleLink);
            sourceIndex = pageLink + 1;
            sourceIndex = source.indexOf('title brk_h', sourceIndex);
        } else {
            break;
        }
    }
}
function parsingArticlePage(source, fileName) {
    var contentBody = "";
    var articleTitle = "";
    var mdFormat = "";
    var sourceIndex = source.indexOf('name="keywords"');
    sourceIndex = source.indexOf('content="', sourceIndex);
    var nextIndex = source.indexOf('"', sourceIndex + 10);
    articleTitle = source.substr(sourceIndex + 9, nextIndex - (sourceIndex + 9));
    sourceIndex = nextIndex;
    console.log('Title = ' + articleTitle);
    sourceIndex = source.indexOf('<div class="innertext brk_h"');
    var endIndex = source.indexOf('<div id="ArticleMapTitle"');
    contentBody = source.substr(sourceIndex, endIndex - sourceIndex - 1);
    contentBody += "</div>";
    var sourceBody = contentBody;
    if(endIndex - sourceIndex - 1 <= 0)
        return;
    articleTitle = articleTitle.replace(/\[/g, "【");
    articleTitle = articleTitle.replace(/\]/g, "】");
    var text = htmlToText.fromString(sourceBody, {
        wordwrap: 130
    });
    contentBody = toMarkdown(contentBody);
    mdFormat += "title: " + articleTitle + "\n";
    mdFormat += "date: 2014-04-10 20:10:28" + "\n";
    mdFormat += "tags: " + "\n";
    var tagIndex = source.indexOf('<div id="article_tag">');
    if(tagIndex > 0) {
        tagIndex += '<div id="article_tag">'.length + 1;
        var tagTail = source.indexOf('<div id="article_author" align="right">');
        var tagEndIndex;
        while(true) {
            var tagStartIndex = source.indexOf('search_fields=tag">', tagIndex);
            tagStartIndex += 'search_fields=tag">'.length;
            if(tagStartIndex < 0 || tagStartIndex > tagTail)
                break;
            tagEndIndex = source.indexOf('</a>', tagStartIndex);
            var articleTag = source.substr(tagStartIndex, tagEndIndex - tagStartIndex);
            console.log(articleTag);
            mdFormat += "- " + articleTag + "\n";
            tagIndex = tagEndIndex;
        }
    }
    mdFormat += "---" + "\n\n";
    text = "    " + text;
    text = text.replace(/\n/g, "\n    ");
    mdFormat += text;
    loadprocess++;
    fs.open('sourcePage' + loadprocess + '.html', 'w', 0666, function(e, fd) {
        if(e) {
            console.log('错误信息：' + e);
        } else {
            fs.write(fd, source, 0, 'utf8', function(e) {
                if(e) {
                    console.log('出错信息：' + e);
                } else {
                    fs.closeSync(fd);
                }
            });
        }
    });
    fs.open('textPC' + loadprocess + '.md', 'w', 0666, function(e, fd) {
        if(e) {
            console.log('错误信息：' + e);
        } else {
            fs.write(fd, mdFormat, 0, 'utf8', function(e) {
                if(e) {
                    console.log('出错信息：' + e);
                } else {
                    fs.closeSync(fd);
                }
            });
        }
    });
    fs.open('oldPC' + loadprocess + '.md', 'w', 0666, function(e, fd) {
        if(e) {
            console.log('错误信息：' + e);
        } else {
            fs.write(fd, contentBody, 0, 'utf8', function(e) {
                if(e) {
                    console.log('出错信息：' + e);
                } else {
                    fs.closeSync(fd);
                }
            });
        }
    });
}
function readWebArticleLink(url) {
    http.get(url, function(res) {
        var source = "";
        //通过 get 请求获取网页代码 source
        res.on('data', function(data) {
            source += data;
        });
        //获取到数据 source，我们可以对数据进行操作了!
        res.on('end', function() {
            parsingArticlePage(source);
        });
    }).on('error', function() {
        console.log("获取数据出现错误");
    });
}
function readWebPage(url) {
    http.get(url, function(res) {
        var source = "";
        //通过 get 请求获取网页代码 source
        res.on('data', function(data) {
            source += data;
        });
        //获取到数据 source，我们可以对数据进行操作了!
        res.on('end', function() {
            branchWebPage(source);
            /*fs.open('hello.txt', 'w', 0666, function(e, fd) {
                if(e) {
                    console.log('错误信息：' + e);
                } else {
                    fs.write(fd, source, 0, 'utf8', function(e) {
                        if(e) {
                            console.log('出错信息：' + e);
                        } else {
                            fs.closeSync(fd);
                        }
                    });
                }
            });*/
        });
    }).on('error', function() {
        console.log("获取数据出现错误");
    });
}

Morris' Blog

第一次來到 Hexo !

contents

序

失敗就是失敗

這是一個搬運的過程，但是宣告失敗

初章

次章