10 dicas sobre como trabalhar com pacotes em R

Uma das características muito atraentes de R é que ele contém uma grande colecção de terceiros pacotes

(coleções de funções em um formato bem definido). Para obter o máximo de R, você precisa entender onde encontrar pacotes adicionais, como fazer o download e instalá-los, e como usá-los.

Bisbilhotando os cantos e recantos do CRAN

o Comprehensive R Rede Archive (CRAN) é uma rede de servidores web em todo o mundo onde você pode encontrar o código-fonte R, manuais R e documentação e contribuíram pacotes.

CRAN não é um único website- é uma coleção de servidores web, cada um com uma cópia idêntica de todas as informações sobre CRAN. Assim, cada servidor web é chamado de espelho. A idéia é que você escolhe o espelho que está localizado mais próximo de onde você é, o que reduz o tráfego internacional ou de longa distância Internet. Você pode encontrar uma lista de espelhos CRAN Aqui.

Independentemente de qual interface R que você usa, você pode salvar permanentemente seu espelho CRAN preferida (e outras configurações) em um arquivo especial chamado .RProfile, localizado no diretório home do usuário ou no diretório de R inicialização. Por exemplo, para definir o espelho Imperial College, Reino Unido como seu espelho CRAN padrão, incluir esta linha em seu .RProfile:

Opções (# 147-repos # 148- = C (CRAN = # 147-http: //cran.ma.imperial.ac.uk/#148-))

Encontrando pacotes interessantes

No início de 2015, havia mais de 6.000 pacotes no CRAN. Isso significa encontrar um pacote para sua tarefa na mão pode parecer difícil.

Felizmente, um punhado de especialistas voluntários foram recolhidos alguns dos pacotes mais utilizados em listas de curadoria. Estas listas são chamados As visualizações de tarefas CRAN. Você pode encontrar pontos de vista de tarefas para financiamento empírica, genética estatística, aprendizado de máquina, a aprendizagem estatística, e muitos outros tópicos fascinantes.

Cada pacote tem sua própria página web em CRAN. Na página web para um pacote, você encontra um resumo, informações sobre os pacotes que são usados, um link para o site do pacote (se tal site existe), e outras informações úteis.

Instalando pacotes

Para instalar um pacote de usar o install.packages () função. Este comando simples download do pacote a partir de um repositório especificado (por padrão, CRAN) e instala-lo em sua máquina:

 > install.packages (# 147-fortunas # 148-)

Note-se que o argumento para install.packages () é uma cadeia de caracteres. Em outras palavras, lembre-se as aspas em torno do nome do pacote!

Em Rgui, bem como em rstudio, você encontra um comando de menu para fazer a mesma coisa:

  • Em Rgui, escolha Pacotes-Instalar pacote (s).

  • Em rstudio, escolher os pacotes Tool-Instalar. . . .

pacotes de carregamento

Para carregar um pacote, você usa o biblioteca() ou require () função. Estas funções são idênticas em seus efeitos, mas diferem no valor de retorno:

  • biblioteca(): Invisível retorna uma lista de pacotes que estão ligados, ou pára com um erro se o pacote não é em sua máquina.

  • require (): retorna VERDADE se o pacote foi ligado com êxito e FALSO se não.

A documentação R sugere que biblioteca() é a forma preferida de pacotes de carga em scripts, enquanto require () é preferido dentro de funções e pacotes.

Então, depois de instalar o pacote fortunas carregá-lo como este:

> biblioteca (# 147-fortunas # 148-)

Note que você não tem que citar o nome do pacote no argumento de biblioteca(), mas é uma boa prática de citar sempre o nome do pacote.

Embora seja possível descarregar um pacote dentro de uma sessão, utilizando o R separar () função, na prática, é geralmente muito mais fácil simplesmente reiniciar a sessão R.

Lendo o manual do pacote e vinheta

O manual do pacote é uma coleção de todas as funções e outra documentação do pacote. Você pode acessar o manual de duas maneiras. A primeira maneira consiste em utilizar o Socorro argumento para o biblioteca() função:

> Biblioteca (help = Número 147-fortunas # 148-)

A segunda maneira é encontrar o manual no site do pacote. Se você apontar a janela do navegador para o A página CRAN para o pacote de fortunas, você verá uma link para o manual em direcção ao fundo da página.

Qualquer que seja a abordagem escolhida, o resultado é um documento PDF contendo o manual do pacote.

Alguns autores pacote também escrever um ou mais vinhetas, documentos que ilustram como usar o pacote. Uma vinheta tipicamente mostra alguns exemplos de como usar as funções e como começar. O importante é que uma vinheta ilustra como usar o pacote com o código R e saída, assim como este livro.

Para ler a vinheta para o fortunas pacote, tente o seguinte:

> vinheta (# 147-fortunas # 148-)

atualização de pacotes

Para garantir que você tenha a versão mais recente de um pacote, use update.packages ():

> () update.packages

Esta função se conecta a CRAN (por padrão) e verifica se há atualizações para todos os pacotes que você instalou no seu computador. Se houver, ele pergunta se você deseja atualizar cada pacote, e em seguida faz o download do código e instala a nova versão.

Se você adicionar update.packages (pergunte = FALSE), R atualiza todos os pacotes de out-of-date na atual localização da biblioteca, sem avisá-lo. Além disso, você pode dizer update.packages () olhar para um outro repositório de CRAN, alterando o repos argumento. Se o repos argumento aponta para um arquivo no seu computador (ou rede), R instala o pacote a partir deste arquivo.

Ambos Rgui e rstudio têm opções de menu que lhe permitem actualizar os pacotes:

  • Em Rgui, escolha pacote (s) Pacotes-Update.

  • Em rstudio, escolha Ferramentas-Check for Updates do pacote. . . .

Ambas as aplicações permitem-lhe seleccionar graficamente pacotes para atualizar.

Avançando com R-Forge

Apesar de não ser uma verdade universal, pacotes em CRAN tendem a ter um nível mínimo de maturidade.

Então, onde é que os pacotes ao vivo que estão no ciclo de desenvolvimento? Muitas vezes, vivem em R-Forge. R-Forge oferece aos desenvolvedores uma plataforma para desenvolver e testar seus pacotes R. Por exemplo, oferece R-Forge

  • Um sistema de compilação e verificação nos sistemas operacionais Windows e Linux (Mac OSX não é suportado)

  • Controle de versão

  • sistemas de Bug-relatório

  • Cópia de segurança e administração

Para instalar um projeto de R-Forge, você também usar o install.packages () funcionar, mas você tem que especificar o repos argumento. Por exemplo, para instalar a versão de desenvolvimento do pacote Tabela de dados, tente o seguinte:

> install.packages (# 147-data.table # 148-, repos = # 147-http: //R-Forge.R-project.org#148-)

Embora R-Forge não tem uma compilação e verificação do sistema para Mac OSX especificamente, os usuários de Mac podem instalar e usar pacotes de R-Forge, instalando o pacote fonte. Você encontra mais informações no FAQ para Mac.

Recebendo pacotes de github

Nos últimos anos, muitos desenvolvedores começaram a usar github como um site de desenvolvimento de código. Embora github não oferece nenhuma das características específicas-R de CRAN ou R-Forge, às vezes o código é mais fácil de compartilhar usando github. Assim, você pode ocasionalmente receber instruções para instalar um pacote diretamente do github.

Nos sistemas operacionais Linux e Mac OSX, instalar pacotes do github é relativamente fácil. No entanto, no Windows, você também deve instalar primeiro RTools (um conjunto de compiladores e outras ferramentas para criar pacotes de origem). Para instalar RTools em uma máquina Windows, siga atentamente as instruções.

Realização de instalações de BioConductor

BioConductor é um repositório de pacotes R e software, um conjunto de ferramentas que se especializa em análise de dados genômicos e afins.

BioConductor tem seus próprios conjuntos de regras para desenvolvedores. Por exemplo, para instalar um pacote de BioConductor você tem a fonte de um script a partir do seu servidor:

> Fonte (# 147-http: //bioconductor.org/biocLite.R#148-)

Em seguida, você pode usar o biocLite () função para instalar pacotes a partir BioConductor. Se você não fornecer um argumento, basta instalar os pacotes básicos necessários a partir do projeto BioConductor.

BioConductor usa extensivamente programação orientação a objetos com aulas S4.

A leitura do manual R

o Nº 147-R Instalação e Administração # 148- Manual é um guia completo para a instalação e administração de R. Capítulo 6 deste manual contém todas as informações necessárias sobre como trabalhar com pacotes.

menu