名刺デジタル化サービス「レゴエンジン」は、個人情報保護やセキュリティ、コンプライアンスに厳しい大手企業様やSaaSベンダー企業様に安心してご利用いただけるよう、 システム・業務においてさまざまなセキュリティ施策を実施しています。
当社クラウドサービスのセキュリティ上もっとも重要な施策は「所有者不保持」のデータ構造です。
当社の名刺データには、スキャンもしくはスマートフォンのカメラで撮影された際に認証された企業システム側の内部ユーザーIDと、
利用企業様ごとに割り当てられた無為の番号が付与されて送られてきます。
当社ではそのIDがどなたのIDかは一切わかりませんし、どの企業であるかもシステム的には保持していません。
つまり、名刺データ(個人情報データ)からは、「どの企業の、どのユーザーが送った名刺か」という「所有者」が、第三者には絶対にわからないため、
仮に名刺データを第三者がみることができたとしても、そのデータの所有者(情報漏えい上の漏えい者)は物理的に解読することは不可能です。
これは、当社の社内のデジタル化処理中でも同様で、社内の作業者であっても、それぞれの名刺データの所有者を知ることはできません。
当社のサービスを構成するシステムは大手IDCのクラウドインフラ上で稼働しており、セキュリティ上、さまざまな施策を行っています。
・Firewallによる不正なアタックの防御
・IPによる接続サーバー/接続環境の制限
・すべての通信においてデータを暗号化
・定期的なセキュリティパッチの適用と診断
・独自Frameworkによるアプリケーションの開発(脆弱ポイントの抑止)
名刺に記載されている項目のうち「個人情報」とされる「氏名」および「メールアドレス」は、黒く塗りつぶし(マスク)された状態でデジタル化処理されます。
したがって、在宅オペレーターや外部の作業者には、個人情報項目は一切見えない仕組みになっています。
当社では名刺のデジタル化処理をフルアウトソーシングで請け負っています。
当社独自の名刺専用OCRによる自動文字認識や膨大な名刺関連辞書を使った名刺の自動データ化システム、国内の在宅オペレーターによる入力、オフショア(中国、カンボジア)での作業、社内での最終品質チェック、その他名刺のデジタル化に特有のノウハウにより、名刺のデジタル化の業務分野では、納品スピード、処理ボリューム、コストにおいて、圧倒的なパフォーマンスを誇っています。
当社では独自で在宅オペレーター&SOHOワーカーのネットワークを確立し、自宅やSOHOからインターネットを通して名刺データの入力業務を行うことができるサービス「RegoEntry(
レゴエントリ)」を運営しています。
24時間365日の稼動と、豊富なワーキングリソースにより、通常のインハウスのデータ入力作業に比べてデータ量の変化に対するスケーラビリティが高く、納品までの時間の短縮と安定化を実現しています。同時に、オペレーターにとっての無駄な待機時間や拘束時間もなく、入力のための機材や座席スペースなどのファシリティも必要としないため、海外でのエントリと同程度のコストで、より高いクオリティのデータ納品を実現しています。
OCRによる名刺の自動文字認識技術はここ数年で進歩しておらず、技術的にほぼ限界となってきています。
実際、最新の名刺OCRの認識率は項目ベースで60〜70%(当社調べ)で、5年前とそれほど変化はありません。
当社では複数の名刺OCRを使い分けることで、自動文字認識精度を向上させ、処理の効率化、高速化、データ入力コストの低減を合わせて実現しています。
当社では100万件を超えるさまざまな「辞書データ」を使って、名刺のデジタル化の効率化、あるいは、データ品質の向上を実現しています。
例えば、氏名カナ、会社名読みカナ辞書に始まり、会社とその会社の正確な住所や電話番号データの辞書や会社と登録されているドメイン名の辞書など、名刺のデジタル化処理におけるノウハウを詰め込んだたくさんの辞書をシステム的に活用することで、OCRの結果やオペレーターが入力した値が本当に正しいか、を効率的にチェックしています。
人が間違えて入力しやすい「文字」や「会社名」をリスクデータとして日々辞書として蓄積し活用することで、データ品質の向上を図っています。
例えば会社名であれば、「キャノン」(正しくは、キヤノン)、「富士フィルム」→富士フイルム、「キューピー」→キユーピーなど、
間違いやすい会社名辞書には、3000以上のデータが登録されています。、
こうして、間違っていそうな「危険なデータ」を自動的に検出して、最後に品質管理者が見てデータを確認/修正をするなどして、納品する名刺データの品質向上に努めています。