User Tools

Site Tools


genetica:wgs

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
genetica:wgs [2020/05/20 08:31]
osotolongo [Opciones extra]
genetica:wgs [2020/08/04 10:58] (current)
Line 3: Line 3:
 El objetivo es definir un procedimiento que procese un numero grande de secuencias WGS en el menor tiempo posible. Para ello,una vez definido el pipeline deberemos automatizar las tareas e integrarlas en el schedule manager del cluster ([[:cluster|Como usar el cluster sin morir en el intento]]).  El objetivo es definir un procedimiento que procese un numero grande de secuencias WGS en el menor tiempo posible. Para ello,una vez definido el pipeline deberemos automatizar las tareas e integrarlas en el schedule manager del cluster ([[:cluster|Como usar el cluster sin morir en el intento]]). 
  
 +** Nota: Aunque el script de ejecución final está integrado en el cluster de Fundació ACE, puede ser modificado fácilmente para integrarlo en cualquier otro cluster que use [[https://slurm.schedmd.com/|SLURM]] y probablemente pueda modificarse para otros //schedule managers//. **
 ===== tl;dr ===== ===== tl;dr =====
 <code> <code>
Line 207: Line 208:
 </code> </code>
  
-<code>+<code perl>
         $orderfile = $outdir.'/validate_'.$pollo.'.sh';         $orderfile = $outdir.'/validate_'.$pollo.'.sh';
         open ORD, ">$orderfile";         open ORD, ">$orderfile";
Line 467: Line 468:
 </code> </code>
 ++++ ++++
- +{{:genetica:its_fucking_cool.gif?300| 
-8-)+8-)}}
 ===== Ejecucion ===== ===== Ejecucion =====
  
Line 633: Line 634:
 Digamos que de un pool de sujetos han fallado 2 o 3. No queremos tener que ejecutar el analisis para todos los sujetos, solo para los que han fallado. No queremos mover los sujetos que han fallado a un nuevo directorio pues atenta contra la organizacion del trabajo y el uso correcto del tiempo. Digamos que de un pool de sujetos han fallado 2 o 3. No queremos tener que ejecutar el analisis para todos los sujetos, solo para los que han fallado. No queremos mover los sujetos que han fallado a un nuevo directorio pues atenta contra la organizacion del trabajo y el uso correcto del tiempo.
  
-Para esto existe la opcion //-cut//+Para esto existe la opcion //-cut// que indica al script que se analice exclusivamente los sujetos contenidos en un archivo de input. 
 + 
 +La forma correcta de utilizarlo es la siguiente. Ejemplo, si solo queremos que se ejecute el analisis en los sujetos //seq-8// y //seq-27//, hacemos el siguiente archivo, 
 + 
 +<code> 
 +[osotolongo@brick03 WGS]$ cat /nas/osotolongo/wgs/only.txt 
 +seq-8 
 +seq-27 
 +</code> 
 + 
 +y tras esto ejecutamos algo como, 
 + 
 +<code> 
 +$ ./wgs.pl -cut /nas/osotolongo/wgs/only.txt -o /the_dysk/BGI_exome/F18FTSEUET0180/WGS /the_dysk/BGI_exome/F18FTSEUET0180/HUMehbE 
 +</code> 
 + 
 +que hara todo el procedimiento pero solo para estos sujetos.
  
 === debug === === debug ===
genetica/wgs.1589963480.txt.gz · Last modified: 2020/08/04 10:48 (external edit)