正则

在这里插入图片描述

正则表达式手册 常用模式解析(6)

此为教程笔记 教程地址:https://study.163.com/course/courseMain.htm?courseId=1209401897 感谢老师:城市数据团大鹏 1.正则表达式快速上手 1.1 正则表达式是什么? 1.2 爬虫中正则表达式的作用是什么 2 正则表达式的模式 简单理解,就是原来表示转义字符的不再表示转义,而就是它原来的意思。如“\n”在python中表示换行,如果想要... »

在这里插入图片描述

Python正则表达式,这一篇就够了!

之前我们讲解了 正则表达式 的起源、发展、流派、语法、引擎、优化等相关知识,今天我们主要来学习一下 正则表达式在 Python语言 中的应用! 大多数编程语言的正则表达式设计都师从Perl,所以语法基本相似,不同的是每种语言都有自己的函数去支持正则,今天我们就来学习 Python中关于 正则表达式的函数。 一、re模块简介 聊到Python正则表达式的支持,首先肯定会想到re库,这是一个Pytho... »

解决过拟合:如何在PyTorch中使用标签平滑正则化

解决过拟合:如何在PyTorch中使用标签平滑正则化

什么是标签平滑?在PyTorch中如何去使用它? 在训练深度学习模型的过程中,过拟合和概率校准(probability calibration)是两个常见的问题。一方面,正则化技术可以解决过拟合问题,其中较为常见的方法有将权重调小,迭代提前停止以及丢弃一些权重等。另一方面,Platt标度法和isotonic regression法能够对模型进行校准。但是有没有一种方法可以同时解决过拟合和模型过度自... »

python基础-三分钟搞定面试官常问的【正则表达式】

正则表达式一、正则表达式的基本符号1.点号” . “2.星号 ” * “3.问号 ” ? “4.反斜杠 ” \ “5.数字 ” \d “6.小括号 “( )”二、在python中正则表达式的使用1.dfindall2.search3.“.”和“.*?”的区... »

关于html字符串正则判断和匹配的具体使用

前言 最近在写一个组件,需要传入html字符串,里面用到了很多正则来判断是否是html标签或者匹配标签内的文本等,这里记录下。 如何判断传入的字符串包含一个闭合html标签 /<\/?[a-z][\s\S]*>/i 这个其实并不能判断标签闭合的完整性或者顺序等,只是判断字符串中是否有html标签(包含自定义标签),这对我来说足够了。这给正则里面需要学习的就是[\s\S]可以代表一切字符... »

正则表达式 语法 分组

概念: 使用单个字符串来描述匹配一系列符合某个语法规则的字符 是对字符串操作的一种逻辑公式 一般用来处理文本和数据 re模块 re模块的相关使用方法: 方法 作用 re.match(pattern, string, flags=0) 尝试从字符串起始位置匹配一个模式,如果不是起始位置匹配成功的话,match()就返回None。 re.search(pattern, string, flags=0)... »

在这里插入图片描述

学Python一定要过的神奇坎—正则表达式(超详细)

正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Python 语言拥有全部的正则表达式功能。 用正则表达式查找电话号码(\d在正则中表示0-9中任一数字) 用 import re 导入正则表达式模块 用re.compile()函数创建一个Regex对象 向Reg... »

在这里插入图片描述

用Python正则实现词频统计并验证Zipf-Law

注: 以长篇小说《追风筝的人》(中文版为例) Zipf-Law: 在给定的语料中,对于任意一个term,其频度(freq)的排名(rank)和频度(freq)的乘积大致是一个常数。 推荐阅读:Zipf and Heaps Laws’ Coefficients Depend on Language 导入中文分词库jieba,Counter库,matplotlib.pyplot库和re库 import... »

Python基础——正则表达式

文章目录1.前言2.单匹配3.多匹配4.按类型匹配5.重复匹配6.分组7.findall(找全部匹配项)8.replace(替换)9.split(切分)10.compile 1.前言 正则表达式 (Regular Expression) 又称 RegEx, 是用来匹配字符的一种工具. 在一大串字符中寻找你需要的内容. 它常被用在很多方面, 比如网页爬虫, 文稿整理, 数据筛选等等. 最简单的一个例... »

java课堂作业:用二维数组存储五个学生姓名学号,并用正则表达式判断输入数据是否有误。输出按学号排序的学生。

输入5个同学的学号和姓名(格式:“姓-名”),存储在二维数组中检查输入同学学号和姓名的格式,不符合要求,则输出提示:“数据格式错误,请重新输入”,对输入同学的信息按学号排序。这是今天java老师布置的课堂作业,排序算法可能不是非常的好。 新建一个studet类,导入以下类 import java.util.Arrays; import java.util.Scanner; import java.... »

Re库与正则表达式的细节解析

Python爬虫 Re库与正则表达式的细节解析

Python爬虫(二十三) 学习Python爬虫过程中的心得体会以及知识点的整理,方便我自己查找,也希望可以和大家一起交流。 —— Re库与正则表达式的细节解析 —— 文章目录Python爬虫(二十三)—— Re库与正则表达式的细节解析 ——1. 麻烦的反斜杠2. 零宽断言 1. 麻烦的反斜杠 上一篇中我们已经提到了,正则表达式使用 ‘’ 字符来使得一些普通的字符拥有特殊的能力(例如 \d表示匹配... »

正则表达式match(), search(), finall()的区别

揭秘match(), search(), finall()的区别,废话不多说,看代码 一、先看后解释 import re str = 'python是世界上最美的语言!我爱你中国!' # match的使用 str_match1 = re.match(r'世界(.*)!', str) print(str_match1) # 结果返回None str_match2 = re.match(r'pytho... »

python爬取2020国家科学技术奖励网站(正则表达式)调用docx转存word

因网站部分网页源码不够规范,所以选择正则表达式代替bs4,有同样需求的朋友可以看一哈~ 这里放上全部代码,但注释较少,有问题可以评论交流。 # -*- coding: utf-8 -*- import urllib.request import re import os from docx import Document from docx.shared import Inches from do... »

CSS选择器中的正则表达式使用

一 是的,CSS也有正则(阿门) CSS装逼两利器:矩阵和正则。 其实呢,我们也不必惊讶,CSS毕竟也是一门语言,而且正则本来就是有利于某个具体语言之外的东西。 二 正则表达式的一些通用规则 无论什么语言,正则表达式的规则都是通用的,差别可能在于书写的形式上。 正则是个很深的话题,真要说开,可以写一本厚厚的书!记住都很难,像我要用的时候,就百度….. 其中,有一些关键的字符,有着特定... »

巧用CSS属性值正则匹配选择器(小技巧)

属性值正则匹配选择器包括下面3种: [attr^="val"] [attr$="val"] [attr*="val"] 这3种属性选择器是字符匹配,而非单词匹配。其中,尖角符号^、美元符号$以及星号*都是正则表达式中的特殊标识符,分别表示前匹配、后匹配和任意匹配。 利用这些选择器,纯CSS就可以做出很炫酷的功能。 <!–... »

(四)Python语法基础之正则表达式

正则表达式 正则表达式使用圆括号“()”表示一个子模式,圆括号内的内容作为一个整体出现。 (一)正则表达式与子模式扩展语法 常用正则表达式元字符: 元字符 功能说明 . 匹配除换行符以外的任意单个字符 * 匹配位于“*”之前的字符或子模式的0次或多次出现 + 匹配位于“+”之前的字符或子模式的1次或多次出现 – 用在[ ]之内用来表示范围 | 匹配位于“|”之前或之后的字符 ^ 匹配行... »

在这里插入图片描述

每天30分钟 一起来学习爬虫——day9(解析数据 之 正则表达式,实例:笑话大全图片爬取)

文章目录常用正则表达式实例:爬取笑话大全的图片 常用正则表达式 单个字符: 符号 含义 . 除换行以外所有字符 [] [a-w] a-w 之间任意一个字符 \d 数字[0-9] \D 非数字 \w 数字、字母、下划线、中文 \W 非\w 的字符 \s 所有的空白字符 \S 非空白 数量修饰 符号 含义 * 任意多次 (>= 0 次) + 至少一次 (>= 1 次 ? 可有可无(0 或 ... »

正则表达式应用详解

Python爬虫 正则表达式应用详解

Python爬虫(二十一) 学习Python爬虫过程中的心得体会以及知识点的整理,方便我自己查找,也希望可以和大家一起交流。 —— 正则表达式应用详解 —— 文章目录Python爬虫(二十一)—— 正则表达式应用详解 ——1. 简介2. 语法 1. 简介 正则表达式:regular expression,也称regex,简称 RE 正则表达式是用来简洁表达一组字符串的表达式 通用的字符串表达框架 ... »

班委收集文件,统计出有谁没交,再也不需要一个一个数了,仅需几行代码(os.walk正则表达式)

数据检索脚本 原理: 利用 os.walk()函数遍历当前文件夹下的所有文件和文件夹得到名称 再利用 正则 与数据库对比,从而得到缺少哪个文件 不仅可以在班委收集数据统计,还可以用于文件对比方面(需改动代码) 使用教程:将脚本放置你所要检索的文件夹,运行就可以了 """ 数据检索脚本—极度简约版 """ import os import re # 建立对比数据 information = [ 10... »

在这里插入图片描述

自己用python做个regex testor正则测试器

因为python的正则测试器软件少,网上在线的网站又没网速,所有想自己折腾个,这样也绝对不会出现匹配问题了… 话不多说,直接上代码 # coding:utf-8 from tkinter import * import re def mode_check(_='None'): global mode mode=0 if var_m.get(): mode=mode|re.M if var_d.ge... »

在这里插入图片描述

省赛题解(14题)

14题 这个题一打开以为是一个摩斯电码,的确是一眼看上去就像是的,菜鸡如我并没有什么别的脑洞 在一位大佬同学的帮忙下,发现这。。居然。。是个二维码?惊了 思路如下: sublime text打开这个txt 发现是这样的 然后使用替换,将\enter转换成换行,注意要勾选上正则,因为会被转码,所以需要多打一个\ 替换完成之后是这样的(看起来有点象二维码了) 继续替换,把点替换成空格,-替换为█(完整... »

在这里插入图片描述

正则表达式RE以及grep、awk和sed工具的用法详解

1.什么是正则表达式 通俗的来说,正则表达式就是处理字串的方法,他是以行为单位来进行字串的处理行为, 正则表达式通过一些特殊符号的辅助,可以让使用者轻易的达到“搜寻/删除/取代”某特定字串的处理程序!正则表达式基本上是一种“表达式”, 只要工具程序支持这种表达式,那么该工具程序就可以用来作为正则表达式的字串处理之用。 例如 vi, grep, awk ,sed 等等工具,因为她们有支持正则表达式,... »

正则表达式 学习笔记

#原子: \d 表示0~9之间的任意【一个】字符->[0-9]自定义原子列表 \D 表示除了0~9之外的任意【一个字符】->[^0-9]自定义排除列表 \s 表示任意【一个】空白字符(不可见字符)->[\n\r\t\v\f]自定义原子列表 \S 表示任意【一个】非空白字符(可见字符)->[^\n\r\t\v\f]自定义排除列表 \w 表示0~9 a~z A~Z和__中的任意... »

在这里插入图片描述

正则表达式匹配

回溯 我理解的就是递归,一直在判断“*”的存在,最后递归得出结果 class Solution: def isMatch(self, s: str, p: str) -> bool: if not p: return not s f= bool(s and p[0] in {s[0],'.'}) if len(p) >= 2 and p[1] == "*": return self.i... »

正则匹配多个字符串

30分钟带你入门python正则表达式

场景: * 字符的匹配 * 爬虫中的使用 * 手机号码,邮箱的匹配 python中使用正则表达式 re模块的使用 re模块是python中正则表达式的包 import re # result = re.match(, ) result = re.match('python', 'ipython is best') if not result: print("no") else: print(res... »

Page 1 of 74123»