memo-2018_1123_1841

memo-2018_1123_1841

cat dp.html | grep 'paging-number'
            <li class="paging-number">1</li>
          <li class="paging-number">1 - 30 / 2232</li>

cat dp.html | grep -E 'class="paging-number".*-' | sed -E 's/<.*>//g'


cat dp.html | grep -E 'class="paging-number".*-' | sed -E 's/<[^>]*>//g'
          1 - 30 / 2232

cat dp.html | grep -E 'class="paging-number".*-' | sed -E 's@.*/ ([0-9]+).*@\1@g'
2232

 

itemprop=”name”という属性はMicrodataと呼ばれる規格で定義されていて、
HTML中に検索エンジンなどのロボットにも読みやすいメタデータを埋め込むための規格。

cat dp.html | grep 'itemprop="name"' | head -5
          <p itemprop="name" class="title">問題解決力とコーディング力を鍛える 英語のいろは</p>
          <p itemprop="name" class="title"><span class="series">情報処理技術者試験</span> 平成<wbr/>31/<wbr/>01<wbr/>年 IT<wbr/>パスポート 合格教本</p>
          <p itemprop="name" class="title">RPA<wbr/>のはじめかた<br/><span class="sub">~ツールを見ながら巡る!<wbr/>RPA<wbr/>の楽しい世界</span></p>
          <p itemprop="name" class="title"><span class="series">情報処理技術者試験</span> 平成<wbr/>31<wbr/>年<wbr/>【春期】<wbr/>/<wbr/>01<wbr/>年<wbr/>【秋期】<wbr/>基本情報技術者 合格教本</p>

cat dp.html | grep 'itemprop="name"' | sed -E -e 's@<br />@ @g' -e 's/<[^>]*>//g' -e 's/^ +//g'
問題解決力とコーディング力を鍛える 英語のいろは
情報処理技術者試験 平成31/01年 ITパスポート 合格教本
RPAのはじめかた~ツールを見ながら巡る!RPAの楽しい世界
情報処理技術者試験 平成31年【春期】/01年【秋期】基本情報技術者 合格教本
ゼロからはじめる ゼロからはじめるiPhone XR スマートガイド ドコモ完全対応版

コメント

タイトルとURLをコピーしました