位置:首页 » 技术2 » scrapy 中的 xpath 怎么使用 contains( text(),‘型号’)限制结果??一直获取不到正确结果

scrapy 中的 xpath 怎么使用 contains( text(),‘型号’)限制结果??一直获取不到正确结果

日期:2016-05-09 阅读:0num
Advertisement

scrapy获取URL为: http://product.dangdang.com/1259526222.html

想获取型号获取不到,想问下大家怎么获取?
1、希望brand返回的是只包括型号的div;
2、希望通过xpath就可以获取;

在scrapy shell中测试是可以的,但是到了编写的时候就拿不到了。。。。

代码:

coding:cp936

from scrapy.spider import BaseSpider
from scrapy.selector import Selector
class dangdang(BaseSpider):
 name='dangdang'
 allowed_domains=[]
 start_urls=['http://product.dangdang.com/1259526222.html']
 def parse(self,response):
  sel=Selector(response)
  title=sel.xpath('//div[@class="head"]/h1/text()').extract()
  brand='\u54c1\u724c'.decode('unicode_escape')#型号
  brand=sel.xpath(('//div[@class="mall_goods_foursort_style_frame" and contains(text(),%s)]/a/text()')%(brand)).extract()

--cut--

imn1在2016-05-09 11:12:19回答到:

应该是编码问题

SoloCompany在2016-05-09 11:12:19回答到:

你最后拼凑出来的那个 xpath 表达式,contains 方法的第二个参数,可以不需要加引号的吗

scrapy 中的 xpath 怎么使用 contains( text(),‘型号’)限制结果??一直获取不到正确结果的相关内容

相关文章
  • ? scrapy 中的 xpath 怎么使用 contains( text(),‘型号’)限制结果??一直获取不到正确结果

    scrapy获取URL为: http://product.dangdang.com/1259526222.html 想获取型号获取不到,想问下大家怎么获取? 1.希望brand返回的是只包括型号的div: 2.希望通过xpath就可以获取: 在scrapy shell中测试是可以的,但是到了编写的时候就拿不到了.... 代码: >#coding:cp936 from scrapy.spider import BaseSpider from scrapy.selector import Selec

  • scrapy 中的 xpath 怎么使用 contains( text(),‘型号’)限制结果??一直获取不到正确结果

    scrapy获取URL为: http://product.dangdang.com/1259526222.html 想获取型号获取不到,想问下大家怎么获取? 1.希望brand返回的是只包括型号的div: 2.希望通过xpath就可以获取: 在scrapy shell中测试是可以的,但是到了编写的时候就拿不到了.... 代码: coding:cp936 from scrapy.spider import BaseSpider from scrapy.selector import Selecto

  • scrapy爬虫日用品-xpath学习

    scrapy爬虫必需品--------xpath学习 XPath 路径表达式 XPath 使用路径表达式来选取 XML 文档中的节点或者节点集.这些路径表达式和我们在常规的电脑文件系统中看到的表达式非常相似.节点是通过沿着路径 (path) 或者步 (steps) 来选取的. 节点 在 XPath 中,有七种类型的节点:元素.属性.文本.命名空间.处理指令.注释以及文档(根)节点.XML 文档是被作为节点树来对待的.树的根被称为文档节点或者根节点. 请看下面这个 XML 文档: <?xml ve

  • selectsinglenode步骤中的xpath

    selectsinglenode方法中的xpath 最常见的XML数据类型有:Element, Attribute,Comment, Text. Element, 指形如<Name>Tom<Name>的节点.它可以包括:Element, Text, Comment, ProcessingInstruction, CDATA, and EntityReference. Attribute, 指在<Employee id="12345">中的粗体部分.

  • java中的xpath,读取xml文档。

    1,入门 XPath即为XML路径语言(XML Path Language),它是一种用来确定XML文档中某部分位置的语言. XPath基于XML的树状结构,提供在数据结构树中找寻节点的能力.起初 XPath 的提出的初衷是将其作为一个通用的. 介于XPointer与XSL间的语法模型.但是 XPath 很快的被开发者采用来当作小型查询语言. 2,了解 如果要定位xml文档中的某一节点,并获取相应的信息.那么可以通过遍历dom树的所有节点进行查找.这样做显然比较麻烦. 于是有了XPat语言来访问

  • XPath语法在C#中使用XPath示例

    XPath可以快速定位到Xml中的节点或者属性.XPath语法很简单,但是强大够用,它也是使用xslt的基础知识. 示例Xml: <?xml version="1.0" encoding="utf-8" ?> <pets> <cat color="black" weight="10"> <price>100</price> <desc>this is a

  • Delphi 中动态创建窗体件 Edit.text 赋值解决方案

    Delphi 中动态创建窗体件 Edit.text 赋值 Form1 fsMDIChild 动态创建 Create(Application); 包含 一个 Edit, 一个 Button 点击 Button, Form2.showmodal Form2 fsNormal 程序开始时就创建(没有从Project --> option 的左侧列表删除) 包含 一个 Edit, 一个 Button 点击 button Form1.edit.text = self.edit.text; self.clo

  • ajax的php返回值中带&lt;meta http-equiv=&quot;Content-Type&quot; content=&quot;text/html; charset=utf-8&quot;解决思路

    ajax的php返回值中带<meta http-equiv="Content-Type" content="text/html; charset=utf-8" ajax的php echo返回值中第一行始终为 <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 有没有办法去掉这个. 分享到: 更多 ------解决方案---

  • Delphi 中动态创设窗体件 Edit.text 赋值

    Delphi 中动态创建窗体件 Edit.text 赋值 Form1 fsMDIChild 动态创建 Create(Application); 包含 一个 Edit, 一个 Button 点击 Button, Form2.showmodal Form2 fsNormal 程序开始时就创建(没有从Project --> option 的左侧列表删除) 包含 一个 Edit, 一个 Button 点击 button Form1.edit.text = self.edit.text; self.clo

  • 请大侠帮忙:&lt;table&gt;中&lt;td&gt;和&lt;td&gt;上面的text都有onclick事件,如何只触发text的onclick

    请大侠帮忙:<table>中<td>和<td>上面的text都有onclick事件,怎么只触发text的onclick? 我的一个table,里面的<td>调用了onclick去改变这个<td>的背景颜色, 这个<td>上有一个text的input,也有onclick事件去改变这个text的背景颜色, 麻烦出来了,我一点text,这个<td>的onclick也触发了, 问问大侠,有没有办法(比如分层)让我点这个text只触

  • 【机房系统学识小结点系列】之遍历窗体中的控件,判断Text是否为空

    [机房系统知识小结点系列]之遍历窗体中的控件,判断Text是否为空? 做机房系统时,几乎每个窗体中都会用到判断界面中的控件是否为空的情景.我们曾经是这样走来的: 第一版: 好处:对窗体界面中的Text等控件,逐一做判断,当用户输入某一项为空的时候,会议弹出框的形式,告诉用户,具体是哪一个控件,输入有误. 坏处:首先,界面看起来就很繁琐:其次,浪费了大量的手工工作,代码不具有可复用性:再次,编码的时候,如果控件数目比较多的话,容易忘记其中的某些控件. If (Trim(txtCardID.Text

  • 请问,VB MScomm和单片机通讯,怎么从接收帧中把数据分离显示在TEXT控件上.多谢

    请教,VB MScomm和单片机通讯,如何从接收帧中把数据分离显示在TEXT控件上.谢谢 通讯协议,Modbus RTU :地址+读功能码+寄存器起始号+数据点数+CRC校验 读1号主机起始地址为40000开始的4个寄存器的值(40011-40014) 发送帧:01 03 00 0A 00 04 64 0B 接收帧:01 03 08 00 E3 00 E3 00 E3 00 E3 32 B0 /////////////////////////// ******略去****************

  • ajax的php返回值中带&lt;meta http-equiv=&quot;Content-Type&quot; content=&quot;text/html; charset=utf-8&quot;该怎么解决

    ajax的php返回值中带<meta http-equiv="Content-Type" content="text/html; charset=utf-8" ajax的php echo返回值中第一行始终为 <meta http-equiv="Content-Type" content="text/html; charset=utf-8" /> 有没有办法去掉这个. ------解决方案-----------

  • jdom中运用xpath需要(jaxen.jar)

    jdom中使用xpath需要(jaxen.jar) jdom中使用xpath需要(jaxen.jar)

  • 在javascript中施用xpath

    在javascript中使用xpath 原文来自: https://developer.mozilla.org/en/Introduction_to_using_XPath_in_JavaScript Introduction to using XPath in JavaScript EDIT WATCH TABLE OF CONTENTS document.evaluate Parameters Return Value Implementing a Default Namespace Res

  • Delphi 中动态创办窗体件 Edit.text 赋值

    Delphi 中动态创建窗体件 Edit.text 赋值 Form1 fsMDIChild 动态创建 Create(Application); 包含 一个 Edit, 一个 Button 点击 Button, Form2.showmodal Form2 fsNormal 程序开始时就创建(没有从Project --> option 的左侧列表删除) 包含 一个 Edit, 一个 Button 点击 button Form1.edit.text = self.edit.text; self.clo

  • 请教VB中Command Button、Label、Text、Form各有什么特有属性、方法、事件

    请问VB中Command Button.Label.Text.Form各有什么特有属性.方法.事件? 请问VB中Command Button.Label.Text.Form各有什么特有属性.方法.事件? ------解决方案-------------------- 楼主:查MSDN吧?

  • 满分用Sendmessage 修改 外部TreeView中的值Key 不是Text

    满分求助用Sendmessage 修改 外部TreeView中的值Key 不是Text hwnd 有了 用TVM_GETITEM能读取到TreeView中所选项的文本了 现需要 修改或读取TreeView中 所选项的值Key 不是Text 哪位大神能帮帮我啊~~~ vb vc都可以 满分求助啊~ hItem = SendMessage(hwnd, TVM_GETNEXTITEM, TVGN_ROOT, ByVal 0&)'获取根节点 SendMessage hwnd, TVM_EXPAND, T

  • 高手指导上 jquery 中 select 控件 ,根据text值来选中项没用

    高手指导下 jquery 中 select 控件 ,根据text值来选中项没用 网上查询看到如下的: 设置select的Text值为JQuery的选中: $("#slc1 option[text='jQuery']").attr("selected", true); 实际上这种没用,高手能指导一下,为什么没用,如果想要text值为jquery的选中,怎么搞,不用循环遍历什么的 ------解决方案-------------------- $("#slc1

  • 好手指导下 jquery 中 select 控件 ,根据text值来选中项没用

    高手指导下 jquery 中 select 控件 ,根据text值来选中项没用 网上查询看到如下的: 设置select的Text值为JQuery的选中: $("#slc1 option[text='jQuery']").attr("selected", true); 实际上这种没用,高手能指导一下,为什么没用,如果想要text值为jquery的选中,怎么搞,不用循环遍历什么的 ------解决方案-------------------- $("#slc1

最新文章
  • 最新 Firefox( 34.0.5)挺好用的,果断把 chrome 给卸载了 最新 Firefox( 34.0.5)挺好用的,果断把 chrome 给卸载了

    非常轻快,清爽.怀念大学时代只用firefox,上网吧第一件事是下载firefox的时代. --cut-- zhouzm在2014-12-18 14:54:2回答到: 你好歹列一下比较下来好用的点吧,否则这贴发在分享发现有什么意思? rainy3636在2014-12-18 15:35:0回答到: 我想知道firefox如何在youtube用html5播放器看视频 FrankFang128在2014-12-18 15:41:2回答到: 增加了视频聊天功能你晓得不 celon在2014-12-18

  • 通讯资费真的很贵? 通讯资费真的很贵?

    今天看到各种要求降低资费的新闻,大家真的觉得现在资费很贵吗?从绝对价格上看,国内通讯费用也不是很贵啊.话说大家每个月通讯话费多少?得多少流量电话短信? 我们这电信语音是按秒计费,我这种一个电话几十秒的人表示1000分钟,1g流量,100m宽带一个月170不算贵啊,而且还可以加副卡共享语音流量.大家觉得呢? --cut-- lion9527在2016-05-09 16:22:21回答到: 套餐内的你有用当然不觉得贵,别人只用2G网络的都没得选择. 这么多学生,农民工,月薪低于平均工资的蜗居人士都被

  • 再見,杭州

    http://lepture.com/zh/2015/beloved-hangzhou 每一次短暫的離去,過後總是回想起杭州的好處,忘卻了討人厭的陰雨天氣. --cut-- lwbjing在2016-05-09 23:42:03回答到: 杭州最近这两天真是够了... ByZHkc3在2016-05-09 23:42:03回答到: 快被这鬼天气烦死了 iamzcd在2016-05-09 23:42:03回答到: 空气越来越差了,已经一个月没晒被子了 iamzcd在2016-05-09 23:42:

  • 史学家:秦始皇究竟是不是私生子 史学家:秦始皇究竟是不是私生子

    秦始皇,是我国的千古一帝,然而,这位赫赫有名的人物,出身似乎并不怎么光彩.民间一直都流传有秦始皇是私生子的说法,那么,秦始皇究竟是不是私生子呢? 众所周知,秦始皇姓赵,史学界有关专家认为,秦始皇生于正月,故起名为正,古代通政,因此写作政.至于为什么姓赵,有人指出秦始皇出生在赵国,古代有以出生地为姓的习俗.也有专家认为,秦始皇为什么会姓赵,是因为赵姓与嬴姓是同一宗,赵姓是嬴姓的一个分支. 秦始皇不仅有赵姓之说,还有人认为他姓吕,是吕不韦的私生子.<史记>记载,嬴政的父亲子楚在赵国做人质时,当时赵

  • 类微信APP,移动互联网第三大入口? 类微信APP,移动互联网第三大入口?

    文/罗超 爱科技网创始人 授权搜狐IT发布 中国移动低调上线飞信公众平台这事儿,在这个微信收费之争的风口,被很多人认为是中移动对腾讯的反击,只是"照着老虎画成了猫".被诟病的地方有两点:一是界面山寨微信公众平台.二是认证账号流程复杂.笔者对以上吐槽持保留意见. 在飞信推出公众平台之前,一直视微信为眼中钉的新浪微博已在内测"微博聚合信息推送平台".阿里巴巴旺信在愚人节也被爆出正在谋求旺信公众平台.靠山寨 Evernote 起家的有道云笔记也于近期推出了公众账号页面.笔

  • 即刻搜索困境重重 竟因邓亚萍缺少互联网精神? 即刻搜索困境重重 竟因邓亚萍缺少互联网精神?

    3年前,带着奥运冠军.剑桥博士和申奥大使的光环,邓亚萍在一片殷切希望中一脚迈进了国家搜索"即刻".3年后,即刻搜索屡传被合并,向人民交了一份市场占有率几乎为零的答卷,邓亚萍也"不知所踪".邓亚萍能打出个世界冠军,也能念出个剑桥博士,却有人将"即刻"比作邓亚萍输得最惨烈的一场比赛,因为在她身上或许缺少一种互联网基因. "即刻"消失? 种种迹象表明,搜索引擎"国家队"--即刻搜索将面临重大变数. 打开即刻搜索,

  • 苦麦菜鲩鱼片滚豆腐

    材料:苦麦菜500克.鲩鱼肉200克.豆腐2块.生姜3片. 烹制:苦麦菜洗净,切段:豆腐用清水泡洗:鲩鱼肉洗净,切薄片,并用生粉.生油.生抽各1汤匙拌腌10分钟.在镬中加清水1250毫升(约5碗量)和生姜,武火煲沸后,下麦菜.豆腐至热,下鱼片滚至刚熟,调入适量食盐和生油便可.此量为3~4人用.

  • 一点资讯app如何收藏新闻 一点资讯app如何收藏新闻

    1.打开一点资讯客户端,进入到一点资讯主界面以后就能看到当天发生的一些实时新闻,点击那个你想要收藏的新闻标题进入,如下图: 2.进入到该新闻的正文界面中,在界面的最底部位置有一个五角星一样的图标,点击该图标,如下图: 3.点击收藏图标以后,界面中就会弹出一个收藏成功的消息提示,如下图: 4.在通过头像进入到个人中心界面,点击界面中的"我的收藏"按钮就能看到我们收藏成功的新闻.

  • 此刻,你是否也在想起我 此刻,你是否也在想起我

    总有一些人进入到你的世界,只需要一瞬间,可是却注定要用一生的时间去忘记.假如在脑海里删除一个人,像电脑一样,刷新就可以,那该多好?-----题记 那日,红尘一回眸,你我文字之城相遇,凝字为香.我沉静在文字天堂,你用柔情似水,揉碎了我坚硬的防备.不为天长地久,不为朝朝暮暮,不许海枯石烂,只愿今生相遇,不言后悔,执着着一份执着,不让心寞落.如果爱需要考验,那么回不去的时间,谁来承担,一个人的光华能有几年?如果爱需要沉淀,那么重逢,是否就是爱的沉淀,已修的爱的圆满?淡淡的墨香,挥洒在清笺里,绿墨小字,

  • 王者荣耀叛逆吟游高渐离魔琴夺命打法攻略 王者荣耀叛逆吟游高渐离魔琴夺命打法攻略

    在王者荣耀的这一款游戏当中高渐离是一名摇滚天王.本与世无争的他,却被卷入了王者峡谷的战争中.他在战斗中用琴音来绝杀敌人,是有输出.的给力法师,无数敌人在他的琴音中沉迷被夺去了生命,而高渐离的音乐之路还远远没有结束,今天小编就来给大家说说高渐离的玩法技巧,想知道的就来跟着小编一起看看. 给各位王者荣耀的玩家们来详细的解析分享一下叛逆吟游高渐离魔琴夺命的打法攻略. 攻略分享: 高渐离携带技能和打法 高渐离可以推荐的携带技能有[防护].[幽灵疾步]和[闪现]等,常规是闪现和防护. 携带闪现,在对线中优

热门推荐
  • 马云香港演讲全文 马云香港演讲全文 马云香港演讲全文 大家晚上好!感谢董先生,感谢团结香港基金给了我这么一个机会跟大家交流.今天我首先,因为我讲话不会讲广东话,我主要是讲国语.因为广东话很多人说是会听不会讲,我是会讲不会听.所以我想今天还是用中文,但是我用汉语的时候我讲话的风格比较快,所以希望大家能够理解,我尽量讲的慢一点. 另外一个,我讲的不一定是对的.但是我希望我讲的给大家一点思考,我同事已经在我上台前不断提醒我别教训香港年轻人,香港年轻人不要听你的教训,我自己觉得我是一个创业15年有很多的经历,更像一个大哥在创业了十多年经历
  • PS蒙板:解决风光摄影中大光比问题的利器 PS蒙板:解决风光摄影中大光比问题的利器 我们在拍摄风光时,不可避免的总会碰到一些大光比的环境,如何解决大光比环境下高光与暗部的曝光问题,我推荐一种超简单的的方法,蒙板,这就是我解决这个问题的核心手段. 那么现在我用最通俗的语句帮大家彻底搞明白蒙板到底是怎样炼成的. 1.前期准备 图1 图2 图3 首先你需要拍摄至少两张不同曝光的照片,一张对地面曝光(此时天空必然过曝,毫无细节,如图1),另一张对天空曝光(此时地面必然欠曝,暗部细节一片死黑,如图2). 我想只要稍微有些摄影基础的朋友都不难拍出这样的照片.这一步请使用手动档曝光,不要开包
  • 驾考宝典科目一模拟考试怎么使用? 驾考宝典科目一模拟考试怎么使用? 1)首先打开驾考宝典,在界面点击[科目一],进入界面点击[模拟考试]. 2)弹出温馨提示点击[确定],在方框输入考生姓名,点击[确认]. 3)在界面选择模拟考试类型点击进入,即可开始考试,做完之后点击[交卷]. 4)由于小编还没做完就提交了,弹出窗口点击[确定],最后就显示考试结果了.
  • 手机微博怎么修改手机来源 手机微博怎么修改手机来源 最近,小编在浏览同事阿呆的微博的时候,发现这小子的微博下面显示:来自iphone 5.这小子用的命名是安卓手机,去哪里认识了一个使用iphone 5的土豪朋友的呢?小编就此问了一下阿呆.原来,阿呆并没有什么使用iphone 5的朋友,是通过手机微博的微博来源功能选择微博来自iphone 5.下面,小编为大家分享一下具体的刘彻个吧! 在手机进入到微博,点击我的这里. 接着在这里选择个性化. 在个性化这里,可以点击微博来源. 接着在这里就可以进行修改自己的微博来源啦. 如不开通会员的话,一般只有2个
  • 中科创达CEO耿增强:移动安全的知道与不知道 中科创达CEO耿增强:移动安全的知道与不知道 中科创达正在利用安卓安全方案以及安全操作系统,来解决人们对于移动安全的困惑. "移动终端安全是一个每个人都知道的问题,但是同时也是每个人都不知道的问题."中科创达软件股份有限公司CEO耿增强表示.基于ARM公司的TrustZone安全技术,这家公司正在打造安卓(Android)安全方案以及安全操作系统(OS). 有人将中科创达形容为"闷声赚钱",或者是"幕后推手".作为一家移动操作系统产品和服务商,一直以来中科创达都是出现在索尼.夏普.高通.展讯
  • 英雄联盟S6发条出装加点攻略 英雄联盟S6发条出装加点攻略 在英雄联盟的这一款游戏里面,S6赛季即将正式开始,那么在全新的S6赛季中中单发条又该怎么出装加点呢?相信这是玩家们都想知道的,那么今天小编就来给各位玩家们来分享一下出装加点的方法,下面就跟小编来一起看看. 给各位英雄联盟的玩家们分享一下S6赛季里中单发条出装以及加点的方法. 分享一览: 发条魔灵 奥利安娜 出装: 出门装 中期 后期神装 技能加点: 主Q副W一级E 有R学R 召唤师技能: 闪现+引燃.闪现+治疗.闪现+传送 天赋加点: 符文: 好了,以上的信息就是小编给各位玩家们带来的英雄联盟的