2010年11月20日

トラフィックエクスチェンジは有効か?

あるサイト開設後1ヶ月、Googleである検索ワードで「19位」でぴったり止まったんすね。
このサイトはブログのように更新を続けるタイプのサイトでは無い。
できればラクしてGoogle検索の1ページ目つまり10位以内に持って生きたいじゃないすか、ねぇご同輩。

で試してみましたトラフィックエクスチェンジ

(1)導入
比較サイトも色々あるので30分の検討の後、大手っぽい5社に登録。
登録後、すぐに使えるサイトとサイト認証に1日かかるサイトもあったりと。
それほど怪しい感じはしない、いや多少するけど。


(2)動かしてみる
もちろん自動動作モード。
自動動作にも、こっちの検索ポイントを手動で割り当てなければならないトコロもあったりする。

最初は「消費電力少ないeeePCにでも夜通しやらせとけ」と思ったのだけど、世の中そんなに甘くない。
RAMディスク対応(http://goo.gl/N97T)した後のeeePCでも2つでギリギリ動作、夜中に流しっぱなしなんてとんでもない。

ここでChromeが実はメモリ開放に問題があるということに気づいた

5年前スペックPC(Core2Duo+メモリ4G)ならすかすか動くけど、電気代もったいない。


(3)んで結論
Google順位は、2日後なんと.....

19位→68位に!

予想していた(だから監視していた)結果であり、ソッコーでトラフィックエクスチェンジを止めました。


(4)後日談
ここも予想の範囲なんだけど...(内心どきどき)

原因があって一気に評価を下げたサイトは、
その原因を除けば一気に評価が戻る


らしいんですね。

本当にそのとおり。
泣きべそをかきながら見守った検索順位は、下げた8日後に元の「19位」に復帰しました。


(5)結論
急にアクセスを増やすようなトラフィックエクスチェンジはGoogle検索上、良い影響は無い。
ある程度のアクセスのあるサイトが、一段と増やせば...などやり方はあるのかも知れんけどね。

Googleさん、ごめんなさい。


以上!
posted by wani at 09:24 | Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする

2010年11月19日

BeautifulSoup/python(1)

WEBサイトから情報を集めて表示するサイトを作りたくなった。
ほいで、ググったところBeautifulSoupっていうのが絶賛されている。
試してみますか

(1)導入
↓からダウンロード
http://www.crummy.com/software/BeautifulSoup/#Download

で「BeautifulSoup.py」をpython的にパスの通ってるディレクトリに設置するだけ!


(2)使い方〜宣言
宣言部分はこんな感じで

from BeautifulSoup import BeautifulSoup




(3)使い方〜切り取り方
pagesというディレクトリ以下のfileですでにhtmlが存在していると仮定

fin=open("pages/"+file)
html=fin.read()

soup = BeautifulSoup(html)
links = soup.findAll('table')
for link in links:
  print link



これでtableタグで囲まれたもの全てか表示されます。
あとはバカ正直に単純に要素を引っ張りたいのであれば

str=link.contents[3].contents[1].contents[2].contents[0].encode('utf-8')


とか書けば中身が引っ張れます。
しかし、実際は判断や加工がいるのでlenとかsearchとかreplaceとかとか...を駆使することになると思います。

....この項、続く。
posted by wani at 11:02 | Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする

2010年11月17日

さくらでWORDPRESS

「コンタクトフォームをつけたい!」といった要望から始まったブログ移行の依頼があり、まぁなんかWORDPRESSっていうのがあるからやってみるべぇな、と。

(1)WORDPRESSをさくら上に導入
見事に何ひとつ考えることなく↓にいわれたとーりで完成。
http://support.sakura.ad.jp/support/manual/rs/wp_man.shtml


(2)アメブロの移行〜吸出し
依頼元からは「無理なら移行しなくても...」と言われたのだけども、まぁ努力くらいするべな。
ここの最新バージョンの0.0.17を利用しました。
http://www.geocities.jp/tool_bou/tool/blog/

「ame-0.0.11.exe」を実行するとアメブロIDを聞いてくるので入力する。
すると、実行ディレクトリ配下にアメブロIDディレクトリが出来て、ダウンロードしたであろうHTMLと移行用らしいテキストファイル(MT形式っていうの?)ができます。


(3)<P>タグの除去
テキストは「〜mt.txt」「〜mt_fc2.txt」「〜mt_seasaa.txt」の3種類できてる。
よーわからんが、今回はfc2でもseesaaでも無いので「〜mt.txt」を使う、根拠無いけど。
で、テキスト開いてみたら改行のたびに<p>タグが入ってる。
適当なテキストエディタで<p></p>タグを除去しましょ。


(4)WORDPRESSへの反映
WORDPRESSの管理画面でプラグインの「Movable Type and TypePad Importer」を導入。
管理画面の左サイドバーから[ツール]→[インポート]を選ぶ。
メインコンテンツ部分にでてくる「Movable Type and TypePad」を選択して、先ほどタグを除去したテキストを選択!
インポート完了!


(5)軽いケバとり
アメブロってコメントごとにアメブロリンクを埋め込むのね。
旧アメブロ側は移転アドレス載せたあとに全削除する予定なので、余計なリンクは新アドレスに変更したい。
よってしこしこ変更スクリプト作成@Python。単純にアメブロURLを新URLに変更するの巻

〜(このあたりには宣言やらDBの接続やら、curでcursor宣言しています)〜
cur.execute("select comment_ID,comment_post_ID,comment_content from wp_comments")
columns=cur.fetchall()
for column in columns:
aid=int(column[0])
bid=int(column[1])
restr=re.sub("http://ameblo.jp/(アメブロID)","http://(新しいURL)",column[2])
cur.execute("update wp_comments set comment_content='%s' where comment_ID=%d and comment_post_ID=%d" % (restr,aid,bid))


以上!試行錯誤もあって半日で完了!
posted by wani at 13:31 | Comment(0) | TrackBack(0) | 日記 | このブログの読者になる | 更新情報をチェックする