Search Server 2008でPDFファイルをクロールする

ページ : 1 2
<この記事を全て表示する場合はこちらをクリック>

PDFファイルをクロール対象に追加

0082

regeditを起動して、以下のPathにアクセスします。”{site GUID}”には各サーバ毎に異なる値が入ります。

\\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Applications\{site GUID}\Gather\Portal_Content\Extensions\ExtensionList

0092

文字列値を新規作成します。

右クリック > 新規 > 文字列値

0103

オブジェクト名を”38″に変更し、値を”pdf”とします。

0113

以下のレジストリ値に登録されている値を確認します。

\\HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\Filters\.pdf

各値は以下のように構成されている必要があります。

<REG_SZ>    Default = <value not set>
<REG_SZ>    Extension = pdf
<REG_DWORD> FileTypeBucket = 1
<REG_SZ>    MimeTypes = application/pdf

0121

以下のレジストリ値を確認し、値が”{E8978DA6-047F-4E3D-9C78-CDBE46041603}”と異なる場合には変更してください。
僕の場合、既定で”{4C904448-74A9-11D0-AF6E-00C04FD8DC02}”が入っていました。

HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\Office Server\12.0\Search\Setup\ContentIndexCommon\Filters\Extension\.pdf

次に、PDF用の画像ファイルを準備します。以下のディレクトリにこのpdfPDF画像を”pdf.gif”という名前に変更して保存します。
※Adobeからダウンロードする場合にはここを参照してください。

C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\12\TEMPLATE\IMAGES

以下のディレクトリの”DOCICON.XML”を開き、さらにその下に記載した文字列を追加します。

C:\Program Files\Common Files\Microsoft Shared\Web Server Extensions\12\TEMPLATE\XML

<Mapping Key="pdf" Value="pdf.gif"/>

サービスの再起動と設定の確認

ここまでの作業が完了したら、以下のコマンドでSearch Server 2008とIISを再起動します。

net stop osearch

net start osearch

iisreset

0131

なんだかほんのりぼやけている気もしなくもないですが、これでPDFファイルに対してアイコンが割り当たります。

0142

ここまでの設定で、再度PDFファイルのインデックス作成を行うと、今まで内容のインデックスが行われなかったPDFファイルのクロールが出来るようになります。

0151
こんな感じです。
※PDF用iFilterをインストールすると、PDF作成者名も表示されるようになります。
 黒塗りされている部分はPDF作成者名です。

参考リンク
Adobe PDF iFilter 9 for 64-bit platforms
http://www.adobe.com/support/downloads/detail.jsp?ftpID=4025

Configuring PDF iFilter for MS Sharepoint 2007.pdf
http://www.adobe.com/special/acrobat/configuring_pdf_ifilter_for_ms_sharepoint_2007.pdf

ページ : 1 2
<この記事を全て表示する場合はこちらをクリック>

1 2

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です