返回

python-搜索文本然后从不同的属性获取href?

发布时间:2022-06-16 17:38:38 274
# node.js

所以我正在尝试构建一个网络爬虫,它可以根据标题获取某些 Oculus Quest 游戏的相应链接。

我遇到的问题是,我设法获取包含我的游戏标题的元素,但无法获取与它关联的 href。

游戏名称存储在

<div class="store-section-item__meta-name">The Last Clockwinder</div>

但href在

<a data-testid="4837365566303714" style="background-image: url(&quot;https://scontent.oculuscdn.com/v/t64.5771-25/39001658_516095626858884_984441088118681220_n.jpg?stp=dst-jpg_q92_s720x720&amp;_nc_cat=1&amp;ccb=1-7&amp;_nc_sid=79b88e&amp;_nc_ohc=jjv9rydHRUoAX_ET7qs&amp;_nc_ht=scontent.oculuscdn.com&amp;oh=00_AT_ZqI3vJRQiSWfhQGqQ-Y0rS8PcVYjpdUkTuXL-BTMa9g&amp;oe=62ADA8BB&quot;);" tabindex="1" class="store-section-item-tile" href="/experiences/quest/4837365566303714"><div class="store-section-item-overlay store-section-item-overlay--hover store-section-item-tile__overlay"><div class="store-section-item-overlay__byline"></div></div></a>

图片参考在这里会很有用,附在下面。 来源:https://www.oculus.com/experiences/quest/section/1888816384764129

这是我的代码

submit = driver.find_element(by=By.XPATH, value="//a[@class='store-section-item-tile']/following-sibling::div[contains(text(), '" + game_title + "')]")

print(submit.get_attribute("href"))

我的想法是找到 <a class... 然后检查 <div 是否包含我的标题。

有人可以帮忙吗?

特别声明:以上内容(图片及文字)均为互联网收集或者用户上传发布,本站仅提供信息存储服务!如有侵权或有涉及法律问题请联系我们。
举报
评论区(1)
按点赞数排序
用户头像