Como a pesquisa de texto por padrão no R

Como qualquer linguagem de programação, R facilita a compilar listas de dados classificados e ordenados. Para encontrar substrings, você pode usar o grep () função, que leva dois argumentos essenciais:

  • padrão: O padrão que você deseja encontrar.

  • x: O vector de caracteres que você deseja pesquisar.

Suponha que você queira encontrar todos os estados que contêm o padrão Novo. Faça isso deste modo:

> Grep (# 147-Novo # 148-, state.name) [1] 29 30 31 32

O resultado de grep () é um vector numérico com as posições de cada um dos componentes que contêm o padrão de correspondência. Em outras palavras, o componente 29 de state.name contém a palavra Novo.

> State.name [29] New Hampshire

Ufa, que funcionou! Mas digitação na posição de cada texto correspondente vai ser um monte de trabalho. Felizmente, você pode usar os resultados de grep () diretamente para o subconjunto vetor original. Você pode fazer isso adicionando o argumento valor = TRUE. Tente isto:

> Grep (# 147-Novo # 148-, state.name, value = TRUE) [1] # 147-New Hampshire # 148- # 147-New Jersey # 148- [3] # 147-Novo México # 148- # 147 New York # 148-

o grep () função é sensível a maiúsculas - que corresponde apenas texto no mesmo caso (maiúsculas ou minúsculas) como seu padrão de pesquisa. Se você procurar o padrão # 147-novo# 148- em minúsculas, os resultados da pesquisa estão vazios:

> Grep (# 147-new # 148-, state.name, value = TRUE) personagem (0)
» » » » Como a pesquisa de texto por padrão no R