Witch7を使ってみよう!

Witch7を快適ご利用いただくために最初に目を通すところ

まずは無料ユーザー登録

まずは無料ユーザー登録♪
無料ユーザー登録はこちらからどうぞ

監視Webサイトを登録してみる

無料ユーザー登録が終わったらログインしてみます。画面中央付近に“Webサイト追加”というボタンが表示されますので、それをクリックするとWebサイトを登録する画面が現れます。
“Eメール サブジェクト”と“ターゲット URL”の2か所をセットし、更新ボタン を押すだけでクローラーが動き出し監視がはじまります。
その他の項目編集が必要な場合、Webサイトエディッター に切り替え編集してください。

WebシンプルリストとWeb詳細リスト

Witch7のコントロール画面は、“Webシンプルリスト”と“Web詳細リスト”の2種類が用意されています。
ある程度の項目がその場更新可能な“Web詳細リスト”。また“Webシンプルリスト”は、必須項目の2か所をセットするだけでクローラーが動き出す簡易設定で、スマホではスクロールが少なくて済みます。
Webリスト切り替えは、メインメニューかWebリストのヘッダーにある で切り替えます。

※ 現在、Web詳細リスト とWebサイトエディッター で編集できる項目に違いはありません。

用意されている容量

Witch7は、ターゲットWebサイトのHTMLデータを保存します。
保存容量に上限がありますが、個人でのご利用では十分な2.56MBが用意されています。
ターゲットWebサイトそれぞれのバイト数は、各Webリストの で表示され、それらの合計はメインメニュー“My Page”のトップページにグラフで表示されています。


ターゲットWebサイト

ターゲットWebサイト各項目の解説

Eメール サブジェクト

ご登録のWebサイト更新で通知されるEメールのタイトルです。
この項目は必須項目で、入力されていないと監視対象とならないのでご注意ください。
文字数は256バイトまで。

ターゲット URL

更新通知を行いたいターゲットWebサイトのURLを入力します。
この項目は必須項目で、入力されていないと監視対象とならないのでご注意ください。
文字数は2048バイトまで。

Webサイト監視間隔

ご登録のWebサイトを監視する間隔で、ドロップダウンリストからご希望の時間を選択します。
一文字変更があっただけでもメールが配信されますから、間隔が短いと頻繁にメールが配信される場合があります。
また、クローラーはターゲットWebサーバーに負荷をかけますので、頻繁なBOTアクセスを嫌うWebサイトもあります。一度嫌われるとターゲットWebサイトに当サイトからアクセスできなくなりますので、監視間隔はそのような配慮も必要です。
通常は人が普通にアクセスする程度の間隔が好ましいとされています。

ステータスコード

“auto”がデフォルトで設定されますが、通常はデフォルトで問題ありません。
しかし、更新された形跡がないのに更新通知メールが頻発する場合など、ターゲットWebサイトの文字コードに合わせることでそのような通知メールが少なくなる場合があります。
ヘルプの“よくある質問 - 更新されていないのに更新通知メールが来る”に詳しく書いてありますので合わせて参考にしてください。

ソートキー

ソートキーは、Webサイトリストを最初表示したときの並び替えに使用します。
文字や数字などお好きな単語を設定できますのでWebサイト管理にご利用ください。
文字数は256バイトまで。

テキストバンド

ご登録Webサイトのテキスト監視対象範囲を絞り込むことで、使用量を節約することができます。
指定できる文字はHTMLタグやHTMLコメント行など全てのテキストを指定できます。

Witch7にはHTMLプレビュー機能 がありますが、テキストエディッターを用いたほうが作業しやすいので、それで説明いたします。
ブラウザは Internet Explorer で説明します。他のブラウザの場合は適せん読み替えてご利用ください。
・ご希望のWebサイトをブラウザで表示します。
・次にキーボードで [Alt]+[v] と [Alt]+[c] を続けてタイプするとHTMLコードをメモ帳で開くことができます。
・これは、ブラウザのメニューバーから [表示] → [ソース] の順にクリックしたのと同じです。
・表示されたHTMLから対象の文字列を選びます。
当然ですがWebサイトオーナーによる更新で削除されにくい文字を探します。
セットしたテキストバンドがうまく機能しているか?確認するにはプレビュー機能 を使います。

以下の条件でテキストバンドは機能します。
・スタート文字列が見つからなかったら先頭から、エンド文字列が見つからなかったら最後までとします。
・スタートとエンドの文字列がいくつか見つかった場合には、最初に見つかった文字からとします。
・スタート文字列がエンドより後に見つかった場合や重なる場合、監視する対象がないということなので検索対象外となります。
・あと、2行にわたる文字列は指定できません。
文字数はスタートとエンドそれぞれ512バイトまで。

エンド文字列は、エンドとファイナルの2箇所設定でき、また、エンドはスタートとファイナルの間で機能します。
言い換えれば、ファイナルの後にエンドが見つかってもファイナル文字が優先されます。
これは物販サイトの新着情報を取得するときに便利です。
例えば、新着情報は新しい順に表示されますのである商品以降に入荷した商品のみを通知したい。しかし、フッターには”おすすめ情報”など頻繁に更新される箇所がある・・・。という場合、おすすめ情報の前の文字列をファイナルに設定し商品名をエンド文字列とすれば、新着情報のみ通知させることができます。

プレビュー機能 は見やすさを優先するためスタートとエンドの文字列を含んで表示しますが、実際のテキストバンドは文字列を省きます。
例えばこのサイトトップページで、スタートとエンド共に“<body class="homepage">”と設定した場合、プレビュー機能 では“<body class="homepage">”と表示されますが、実際の監視対象は0byteとなりクロールから外されます。
スタートとエンドの文字列は重ならないようにしましょう。

タイムバンド

Witch7クローラーの稼働時間帯を設定します。“start”と“end”共に同じ時間だと24時間稼働します。
タイムバンドは日付をまたいで時間をセットできます。例えば“start”に“10:00”, “end”に“03:00”をセットすると、“10:00”~“翌日03:00”までクローラーが稼働しその他の時間帯はお休みです。
タイムバンドは“Webサイト監視間隔”でも説明しましたように、より人らしいアクセスのためにクロール時間をコントロールすることが推薦されます。

それとイレギュラーの例えですが、“Webサイト監視間隔”が12時間で、“start”が“10:00”, “end”は“20:00”場合、クローラー稼働時間10時間に12時間が過ぎてしまい14時間はお休みですので“start”の“10:00”にクローラーが働き始めます。
つまり、間隔に12時間を設定しても24時間に1度クロールされることになります。

ポーズ

ターゲットWebサイトを削除しなくても一時的にクロールを停止することができます。
完全に監視を行わない場合は、一時停止だと使用バイト数はそのまま残りますので削除した方が容量節約になります。

メモ

注釈などコメントとして自由なテキストを入力できます。
文字数は512バイトまで。

アッドライン

アッドラインはチェックすることにより、新規や編集による追加行があった場合のみ更新通知を行います。
少し専門的な話をすると、ブログ提供会社によってはXMLを作成する際に追加と削除を別々にBATCHで行う会社も存在します。このような場合、タイミングによっては1回の更新で2度更新通知を受け取ることになりますし、また、単純に追加や編集しか通知を受け取りたくない・・・という方に重宝する機能です。


オートログイン

Witch7 のオートログインについて

オートログインとは?

ブラウザ機能の一つ、cookieを利用し次回から自動でログインを行うもので、毎度ログインを行うという手間から解放され、スマホやPCなど複数の端末で有効にできます。
オートログインの有効期限は、最終アクセスから7日間です。
cookieには個人情報につながるデータは保存しませんし高度な暗号化を行っていますが、第三者が扱う可能性がある端末ではオートログインを使用しないでください。