Saya mencoba mengikis tanggal rilis dari HTML berikut:

<li class="product game_product first_product">
    <div class="product_wrap">
        <div class="basic_stat product_title">
            <a href="/game/nintendo-64/the-legend-of-zelda-ocarina-of-time">
                The Legend of Zelda: Ocarina of Time
                (N64)
            </a>
        </div>
        <div class="basic_stat product_score brief_metascore">
            <div class="metascore_w small game positive">99</div>
        </div>
        <div class="more_stats condensed_stats">
            <ul class="more_stats">
                <li class="stat product_avguserscore">
                    <span class="label">User:</span>
                    <span class="data textscore textscore_outstanding">9.1</span>
                </li>
                <li class="stat release_date full_release_date">
                    <span class="label">Release Date:</span>
                    <span class="data">Nov 23, 1998</span>
                </li>
            </ul>
        </div>
    </div>
</li>

Upaya:

Dates = pageSoup.find_all("li", {"class": "stat release_date full_release_date"})
Dates = pageSoup.find_all("span", {"class": "data"})

Saya telah mencoba mendapatkannya dengan stat release_date full_release_date dan data tetapi itu termasuk elemen skor dan label. Apakah ada cara untuk hanya mengikis Nov 23, 1998?

Hasil nyata:

                                               Games                            Dates
0  \n\n                            The Legend of ...  \nRelease Date:\nNov 23, 1998\n
1  \n\n                            Tony Hawk's Pr...  \nRelease Date:\nSep 20, 2000\n
                                               Games         Dates
0  \n\n                            The Legend of ...           9.1
1  \n\n                            Tony Hawk's Pr...  Nov 23, 1998

Hasil yang diharapkan:

                                               Games         Dates
0                                  The Legend of ...  Nov 23, 1998
1                                  Tony Hawk's Pr...  Sep 20, 2000
0
Snooley 27 Februari 2020, 18:54

1 menjawab

Jawaban Terbaik

Cara yang benar untuk mendapatkan data dari full_release_date:

Dates = pageSoup.select("li.stat.release_date.full_release_date .data")
1
Sers 27 Februari 2020, 16:04