忍者ブログ

開発者ブログ

忍者ブログの元開発者が送る愛と感動と涙のスペクタクル。プログラムの開発日誌やタダの日記です。

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

Shinobiライティングの誤字脱字チェックとアカウント変更の話

私は某掲示板の「Shinobiライティング 〇文字目」を良く見ています。
この間、私のブログを見てくれてそうなレスも拝見しました。

私は基本、透明感のあるサービス運営が好きなので、なるべくオープンにやって行きたいと考えています。
某掲示板に社員が出てしまうのは個人的にルール違反だと考えているので、あちらでは返しませんが、何かご要望とかご意見とかご質問とかあれば是非「非公開コメント」でも頂ければと思います。(コメントに非公開希望とか書いていただければ公開しません。)

私はShinobiライティングの担当に決まった際、Shinobiライティングに関する記事を書いていただけている数名の方にコメントをさせていただきました。
私自身、ライター様がShinobiライティングをどのように感じているかを知りたかったためです。
書いたコメントは「いろいろご意見をください」のような内容です。

私はライターの皆様とコミュニケーションを取りたいと考えています。
実装したいことの相談や、実装後の感想、皆様の考えるご要望など、いろいろな話し合いをしたいと考えているのです。
是非気が向きましたらコメントをいただければと思います。
(そのうちShinobiライティング上でQ&Aシステムを導入し、その場で意見の交換などをさせて頂くかも知れません。)


さて。某掲示板のスレッドで、昨日は誤字脱字判定の話が出ていました。

>吸収の「吸」って字が誤字脱字判定で黄色くなりまくった

こんなコメントがありましたが、これは正しい場合も引っかかってしまうケースがありますね。
「石の硬度が高い」なんていう文字も誤字として認識されてしまったりします。

誤字脱字の自動判別はデータベースを使用した判定のため、稀ですが間違った判定もします。
そのため、厳密な正誤判定には適していません。
現在のところは注意を促すためのツールですので、間違っていないと判断された場合はそのまま投稿していただければと思います。
※ただし、今後は自動判定に使う可能性があります。その時は違う言い回しに変えていただければ・・・などと考えています。


また、「アカウントを良く変えている」というコメントも見受けられました。
こちらは、デメリットしかないと思うのでお勧めしません。
以下につらつらとその理由を書いてみます。

理由1.過去記事チェックにアカウントが関係ないから

弊社の過去記事チェックは個人のみだけではなく、全記事から判定します。
これは、過去記事チェックの必要性を考えていただければお分かりいただけるのではないかと思います。

過去記事チェックはコピーコンテンツチェックの一種です。
クライアント様のニーズの一つとして、コンテンツの重複が無い記事であることが上げられます。
記事の品質とは、「クライアント様のニーズ」に合っているかどうかであると考えています。
「別アカウントであれば同じような記事が書かれても良い」というニーズは、クライアント様にはないと思うのです。

そのため、弊社の過去記事チェックには個人投稿での重複チェックというセグメントはありません。

逆に、ライター様のニーズである「なるべく承認にしてもらいたい」や「なるべく稼ぎたい」のことも考えています。
過去記事チェックは常に最適になるようにチェックをしています。

個人投稿での過去記事チェックの重複が通常では発生しないレベルで調整しています。

ロジックや閾値を調整する際、プログラムを書き換えるのは非常に容易ですが、その何倍もの時間を問題ありと判定された記事を読むことに費やしています。

私が見た感じ、過去記事で引っかかる方は以下のような方です。

・元記事を流用してリライトしている
・起承転結をテンプレート化している
・接続詞を多用されたり、似たような修飾文が多すぎる

これは、結果的に悪文になってしまったりコピーコンテンツとして検知されてしまうので、極力避けた方が良いかと思います。
もしくは、あまり大きな声では言えませんが、もっと精度を上げていただければ・・・と思います。

そんな理由が、アカウントを変えるのが無駄という理由の一つ。

理由2.ライターランクで不利になるから

もう一つは先日書いたライターランク導入の話。

ライターランクは、基本的には加点方式になると思います。(減点つけると思いますが)
その場合、長期間継続利用という点も加える可能性があります。
そのため、アカウントを変えることはデメリットにしかならないと思うのです。
(現時点で後ろめたいことをされている場合は変えた方が良いかも知れません。アカウント変更後にきちんとした記事を書いていただけるのであれば推奨します。)

ライター様にはいろいろな角度から加点をしたいと考えています。(個人的には)

・記事の品質の高さ(自動判定及び目視加点)
・記事の投稿数の多さ(もしくは文字数)
・登録後の期間(正確には稼働日数)
・誰も書きたがらない案件を書いてくれた記事数(もしくは文字数)
・超マニアックな案件を書いてくれた記事数(もしくは文字数)

他にも出てくると思いますが、「貢献度」「品質」「投稿量」の3軸のポイントバランスで作りたいと考えています。

ライターランクが高い場合、以下のような仕組みにしたいと考えています。

・記事の複数エントリーが出来る(一定数、一定期間)
・高単価案件の優遇
・特定案件公開のお知らせ

現在、正直なことを言いますと超高単価案件をプロライターの方に書いていただいております。
弊社のライター様の中にもこのような案件を書くことが出来る方がいると思っています。
来年度は、より一層高品質が求められる案件が多くなります。

皆様に良い案件を書いていただけるようにいろいろ試行錯誤していきます。
是非皆様も良い案件を取れるように準備をしていただければと思います。

拍手[1回]

PR

Shinobiライティングに過去記事チェッカーを導入しました。



過去記事チェッカーを導入しました。

私はここ一年ほどShinobiライティングの開発を進めております。
ここ最近進めているのは、記事の品質向上施策です。

その一環で、本日Shinobiライティングに過去記事チェッカーを導入しました。
目的は記事の品質向上と、承認率の向上です。

記事の品質を上げるためにチェックロジックの閾値を上げることは可能ですが、そのためにライター様への報酬(時給換算)が下がってしまうのは問題です。
このどちらも実現させるために、投稿後に審査を行う従来タイプのものではなく、投稿時点でチェックを行い、問題があった場合には差し戻して再投稿をしていただく形にしました。

今回導入したものは「過去に投稿された記事との重複チェック」です。

同じような記事を何記事も納品されてしまうのは問題となってしまいます。
これを改善させるためのチェッカーとなっております。

Shinobiライティングでは、他にも様々な自動チェックや目視による確認などが行われていますが、自動で判定できるチェック部分はなるべく投稿時にチェックを行い、記事の修正が出来るようにしていきたいと考えております。


今後検討しているチェックについて

記事の品質を計測するためには、いくつかの点があると考えています。

・コピーコンテンツの重複率
 WEB上に存在するコンテンツとの重複率
 過去に投稿されたコンテンツとの重複率

・記事内容の重複率
 文章の内容、文脈の一致等での重複率(文字、単語の一致ではない)

・日本語構文チェック
 表記ゆれ、誤字脱字、接続詞頻出、助詞連続使用等

・事象の事実確認、ソース元等のチェック
 日本の人口が5億人を超えましたが←事実と異なる

・クライアントのニーズに合っているか
 希望通りの内容であるか、無関係な記載がないか

日本語の解析には、形態素解析、係り受け解析、構文解析、意味解析、文脈解析などなど、様々な解析があります。
自動で判別出来ないこともありますが、様々な解析を作ることで大よそ自動化することが可能です。
実際、解析のシステム自体はだいぶ整ってきており、ライター様にどのように指摘をするのか、閾値をどこに設定するかの調整段階となっています。

クライアント様や案件によってはチェックが不要なものもあります。
品質と納品速度は反比例するものであると考えており、そこを調整するものが記事の単価であると考えています。

様々なニーズがある中で、クライアント様のニーズとライター様のニーズのそれぞれに応えられるであろう最適解が出せた時点で、他のフィルターを導入して行きたいと考えています。


個人的に企んでいること

ライターランクを導入したいと考えております。
だいぶ前から提案しておりますが未だに実現できてない案件の一つです。

今後、Shinobiライティングではより高品質な案件を増やしていきたいと考えているのですが、ライター様にはどうしても品質のバラつきがあります。
高品質な案件ほど高単価な案件になると考えておりますが、高単価な案件はどうしてもすぐになくなってしまう傾向があります。
あまり品質が高くない記事を書いているライター様に記事を書かれてしまうと、クライアント様はもとより、高品質な記事を書くライター様にも機会損失となってしまうため、色々と問題があると考えているのです。

そのため、品質や貢献度に関するライターのランクを導入し、ランクに応じた公開制限を設けたらどうかと考えているのです。

その際は過去に投稿された記事品質によるポイントや貢献度によるポイントなどから集計してそれぞれのランク分けを行うことになるかと思います。

・・・出来たらいいなー。

拍手[0回]

Shinobiライティング GWキャンペーン



GW限定のキャンペーンが5月1日から始まりました。
初日はとても盛況だったようで、30,000文字オーバーの方が数名おりました。
(普段は3万超えると1位になることがほとんど。)

今回のキャンペーンは「投稿文字数によるデイリーランキング」です。
毎日AM0時~23時59分59秒までの投稿でランキングを行い、毎日1位~20位の方にポイントをプレゼントする企画です。
無理のない範囲でご参加いただければ幸いです。

拍手[1回]

Shinobiライティングにおける記事のチェック

こんばんは。misneyです。
先日お陰様で40歳になりました。
misneyは近頃、40歳男性として一人称をmisneyとするのは如何なものだろうと考えてみたりみなかったりしております。

本日は私が従事しているShinobiライティングにおける記事のチェックに関する記事を書こうと思います。

記事チェッカーの話

3月中旬~つい先日まで、投稿フォームに「記事チェッカー」というものを導入していました。
作成いただいた記事を投稿する前に「承認に関するチェック」と「誤字脱字のチェック」の2種類のチェックを行うものです。

記事チェッカーには3種類の目的がございます。

1.ライター様の承認率の向上
2.クライアント様への記事品質の向上
3.承認率向上によるオペレーターのリソース削減

記事チェッカーを導入した結果、評判は上々(私調べ)だったのですが、想定よりも効果が無かった点、近日中により高度な構文チェックを近日中に導入する予定がございまして、一時的に「承認に関するチェック」を外させていただきました。

より高度な構文チェックの導入がある程度進みましたら、また承認に関するチェックを導入したいと考えています。

高度な構文チェックの話

記事チェック導入後、個人的には初めて投稿された記事をじっくりと拝見しました。
残念ながら承認されなかった記事を拝見すると、稚拙な文章が多く見受けられました。
記事チェッカーの目的で書いた2の部分を疎かにすることは出来ません。
ライター様には大変申し訳ない気持ちではあるのですが、稚拙な文章というものは非承認とさせていただいております。

この稚拙な文章とはなんぞや?となり、調べてみました。
下記のような文章の場合、意味が解らない文章や稚拙な文章に見えてしまうようです。

1.漢字を使わない
2.主語、述語の関係性が無い
3.助詞の連続使用
4.ら抜き・さ入れ表現
5.誤字脱字
6.表記ゆれ
7.修飾語・修飾節の乱用
8.接続詞の乱用
9.同一文末表現の多用
10. 文体(ですます調等)の揺れ

弊社には存在しないチェック項目もありまして、このような構文チェックのフィルターを追加していこうと考えております。

導入予定は数週間~数カ月後です。
もしライター様がこちらの記事を見られましたら、是非上記のような点にお気をつけいただければと思います。


拍手[0回]

Wordpressのブルートフォース攻撃(不正ログイン)について

今日、Wordpressで不正ログインが!なニュースを良く見かけました。

私は仕事柄数千のWordpressを扱っているので良く攻撃が来ております。(幸いにも不正ログイン成功はありません)
最近攻撃のログを取っていたので攻撃の傾向を書いておきます。

使用するログデータの取得期間は2013/08/20~2013/08/29です。
期間中の攻撃確認数は413,467件。


攻撃者の特徴

特徴は3種類くらいあります。(恐らく別人。)

1.ユーザー名adminかAdministratorでくるタイプ
2.ユーザー名をドメイン名に指定して来るタイプ
3.ユーザー名を取得して(/?author=1とかで)来るタイプ

使用されるアカウント

アタックで良く見かけるアカウントの情報です。
Wordpressのログインアカウントに以下を使用していると危険です。気をつけましょう。

使用されたアカウント名攻撃回数
admin216,003
host名115,363
administrator72450
Admin5,006
ニックネーム3,941
※Host名は例えば shinobi.jp であれば shinobiをアカウントとして使ってきます
※ニックネームはちゃんと変えてないとアカウントと同じになってしまってる場合あり。
※第6位は root で54件でした。以下極端に減ります。


日付別攻撃回数

攻撃数です。
昨日今日のことが取り上げられてましたが、私のところは逆に減少傾向かも?
土日は休んでるみたいです。

2013/8/20117,861
2013/8/21104,085
2013/8/2265,336
2013/8/233,634
2013/8/245,277
2013/8/251,597
2013/8/261,052
2013/8/2732,025
2013/8/2834,274
2013/8/2948,326
使用されるパスワード

使用されたパスワードは約4,500種類ありました。
テキストファイルに纏めましたので、不安な方は使用しているパスワードが該当しないか調べてみてください。

使用されてるパスワード.txt


Wordpressはログインを許してしまうとPHPの設置が出来てしまうため、かなり大きな被害が出ます。
共有のCMSサービスに限らず、全てのWordpressに危険が色々存在しますので再度確認した方が良いかも知れません。


拍手[1回]

おまとめボタン

忍者カウンター

忍者ビジター

忍者アド

ブログ内検索

最新コメント

プロフィール

HN:
mizuno
年齢:
43
HP:
性別:
男性
誕生日:
1974/02/13
職業:
主に侍などを少々
趣味:
SEO(「申し訳ございません」や「指ぱっちん」「指定したサイトへは接続できませんでした」でググルと上位に。)
自己紹介:
母子手帳の仮死と書かれてる場所に丸されてます。

フリーエリア

忍者ツールズプロフィール

忍者ツールズプロフィールは終了しました