Diff for /loncom/metadata_database/searchcat.pl between versions 1.55 and 1.56

version 1.55, 2004/04/08 15:57:32 version 1.56, 2004/04/09 22:04:53
Line 71  use lib '/home/httpd/lib/perl/'; Line 71  use lib '/home/httpd/lib/perl/';
 use LONCAPA::Configuration;  use LONCAPA::Configuration;
 use LONCAPA::lonmetadata;  use LONCAPA::lonmetadata;
   
   use Getopt::Long;
 use IO::File;  use IO::File;
 use HTML::TokeParser;  use HTML::TokeParser;
 use GDBM_File;  use GDBM_File;
 use POSIX qw(strftime mktime);  use POSIX qw(strftime mktime);
   
 use File::Find;  use File::Find;
   
   #
   # Set up configuration options
   my ($simulate,$oneuser,$help,$verbose,$logfile,$debug);
   GetOptions (
               'help'     => \$help,
               'simulate' => \$simulate,
               'only=s'   => \$oneuser,
               'verbose=s'  => \$verbose,
               'debug' => \$debug,
               );
   
   if ($help) {
       print <<"ENDHELP";
   $0
   Rebuild and update the LON-CAPA metadata database. 
   Options:
       -help          Print this help
       -simulate      Do not modify the database.
       -only=user     Only compute for the given user.  Implies -simulate   
       -verbose=val   Sets logging level, val must be a number
       -debug         Turns on debugging output
   ENDHELP
       exit 0;
   }
   
   if (! defined($debug)) {
       $debug = 0;
   }
   
   if (! defined($verbose)) {
       $verbose = 0;
   }
   
   if (defined($oneuser)) {
       $simulate=1;
   }
   
 ##  ##
 ## Use variables for table names so we can test this routine a little easier  ## Use variables for table names so we can test this routine a little easier
 my $oldname = 'metadata';  my $oldname = 'metadata';
Line 104  if ($wwwid!=$<) { Line 143  if ($wwwid!=$<) {
 #  #
 # Let people know we are running  # Let people know we are running
 open(LOG,'>'.$perlvar{'lonDaemons'}.'/logs/searchcat.log');  open(LOG,'>'.$perlvar{'lonDaemons'}.'/logs/searchcat.log');
 print LOG '==== Searchcat Run '.localtime()."====\n";  &log(0,'==== Searchcat Run '.localtime()."====");
   if ($debug) {
       &log(0,'simulating') if ($simulate);
       &log(0,'only processing user '.$oneuser) if ($oneuser);
       &log(0,'verbosity level = '.$verbose);
   }
 #  #
 # Connect to database  # Connect to database
 my $dbh;  my $dbh;
 if (! ($dbh = DBI->connect("DBI:mysql:loncapa","www",$perlvar{'lonSqlAccess'},  if (! ($dbh = DBI->connect("DBI:mysql:loncapa","www",$perlvar{'lonSqlAccess'},
                           { RaiseError =>0,PrintError=>0}))) {                            { RaiseError =>0,PrintError=>0}))) {
     print LOG "Cannot connect to database!\n";      &log(0,"Cannot connect to database!");
     die "MySQL Error: Cannot connect to database!\n";      die "MySQL Error: Cannot connect to database!\n";
 }  }
 # This can return an error and still be okay, so we do not bother checking.  # This can return an error and still be okay, so we do not bother checking.
Line 122  my $request = &LONCAPA::lonmetadata::cre Line 166  my $request = &LONCAPA::lonmetadata::cre
 $dbh->do($request);  $dbh->do($request);
 if ($dbh->err) {  if ($dbh->err) {
     $dbh->disconnect();      $dbh->disconnect();
     print LOG "\nMySQL Error Create: ".$dbh->errstr."\n";      &log(0,"MySQL Error Create: ".$dbh->errstr);
     die $dbh->errstr;      die $dbh->errstr;
 }  }
 #  #
 # find out which users we need to examine  # find out which users we need to examine
 opendir(RESOURCES,"$perlvar{'lonDocRoot'}/res/$perlvar{'lonDefDomain'}");  my $dom = $perlvar{'lonDefDomain'};
   opendir(RESOURCES,"$perlvar{'lonDocRoot'}/res/$dom");
 my @homeusers =   my @homeusers = 
     grep {      grep {
         &ishome("$perlvar{'lonDocRoot'}/res/$perlvar{'lonDefDomain'}/$_");          &ishome("$perlvar{'lonDocRoot'}/res/$dom/$_");
     } grep {       } grep { 
         !/^\.\.?$/;          !/^\.\.?$/;
     } readdir(RESOURCES);      } readdir(RESOURCES);
 closedir RESOURCES;  closedir RESOURCES;
 #  #
   if ($oneuser) {
       @homeusers=($oneuser);
   }
   #
 # Loop through the users  # Loop through the users
 foreach my $user (@homeusers) {  foreach my $user (@homeusers) {
     print LOG "=== User: ".$user."\n";      &log(0,"=== User: ".$user);
     my $prodir=&propath($perlvar{'lonDefDomain'},$user);      &process_dynamic_metadata($user,$dom);
     #      #
     # Use File::Find to get the files we need to read/modify      # Use File::Find to get the files we need to read/modify
     find(      find(
Line 152  foreach my $user (@homeusers) { Line 201  foreach my $user (@homeusers) {
 }  }
 #  #
 # Rename the table  # Rename the table
 $dbh->do('DROP TABLE IF EXISTS '.$oldname);  if (! $simulate) {
 if (! $dbh->do('RENAME TABLE '.$newname.' TO '.$oldname)) {      $dbh->do('DROP TABLE IF EXISTS '.$oldname);
     print LOG "MySQL Error Rename: ".$dbh->errstr."\n";      if (! $dbh->do('RENAME TABLE '.$newname.' TO '.$oldname)) {
     die $dbh->errstr;          &log(0,"MySQL Error Rename: ".$dbh->errstr);
           die $dbh->errstr;
       } else {
           &log(1,"MySQL table rename successful.");
       }
 }  }
   
 if (! $dbh->disconnect) {  if (! $dbh->disconnect) {
     print LOG "MySQL Error Disconnect: ".$dbh->errstr."\n";      &log(0,"MySQL Error Disconnect: ".$dbh->errstr);
     die $dbh->errstr;      die $dbh->errstr;
 }  }
 ##  ##
 ## Finished!  ## Finished!
 print LOG "==== Searchcat completed ".localtime()." ====\n";  &log(0,"==== Searchcat completed ".localtime()." ====");
 close(LOG);  close(LOG);
   
 &write_type_count();  &write_type_count();
Line 171  close(LOG); Line 225  close(LOG);
   
 exit 0;  exit 0;
   
   ##
   ## Status logging routine.  Inputs: $level, $message
   ## 
   ## $level 0 should be used for normal output and error messages
   ##
   ## $message does not need to end with \n.  In the case of errors
   ## the message should contain as much information as possible to
   ## help in diagnosing the problem.
   ##
   sub log {
       my ($level,$message)=@_;
       $level = 0 if (! defined($level));
       if ($verbose >= $level) {
           print LOG $message.$/;
       }
   }
   
 ########################################################  ########################################################
 ########################################################  ########################################################
 ###                                                  ###  ###                                                  ###
Line 205  sub only_meta_files { Line 276  sub only_meta_files {
 sub print_filename {  sub print_filename {
     my ($file) = $_;      my ($file) = $_;
     my $fullfilename = $File::Find::name;      my $fullfilename = $File::Find::name;
     if (-d $file) {      if ($debug) {
         print LOG " Got directory ".$fullfilename."\n";          if (-d $file) {
     } else {              &log(5," Got directory ".$fullfilename);
         print LOG " Got file ".$fullfilename."\n";          } else {
               &log(5," Got file ".$fullfilename);
           }
     }      }
     $_=$file;      $_=$file;
 }  }
Line 217  sub log_metadata { Line 290  sub log_metadata {
     my ($file) = $_;      my ($file) = $_;
     my $fullfilename = $File::Find::name;      my $fullfilename = $File::Find::name;
     return if (-d $fullfilename); # No need to do anything here for directories      return if (-d $fullfilename); # No need to do anything here for directories
     print LOG $fullfilename."\n";      if ($debug) {
     my $ref=&metadata($fullfilename);          &log(6,$fullfilename);
     if (! defined($ref)) {          my $ref=&metadata($fullfilename);
         print LOG "    No data\n";          if (! defined($ref)) {
         return;              &log(6,"    No data");
     }              return;
     while (my($key,$value) = each(%$ref)) {          }
         print LOG "    ".$key." => ".$value."\n";          while (my($key,$value) = each(%$ref)) {
               &log(6,"    ".$key." => ".$value);
           }
           &count_copyright($ref->{'copyright'});
     }      }
     &count_copyright($ref->{'copyright'});  
     $_=$file;      $_=$file;
 }  }
   
Line 237  sub log_metadata { Line 312  sub log_metadata {
 ##   Only input is the filename in $_.    ##   Only input is the filename in $_.  
 sub process_meta_file {  sub process_meta_file {
     my ($file) = $_;      my ($file) = $_;
     my $filename = $File::Find::name;      my $filename = $File::Find::name; # full filename
     return if (-d $filename); # No need to do anything here for directories      return if (-d $filename); # No need to do anything here for directories
     #      #
     print LOG $filename."\n";      &log(3,$filename) if ($debug);
     #      #
     my $ref=&metadata($filename);      my $ref=&metadata($filename);
     #      #
     # $url is the original file url, not the metadata file      # $url is the original file url, not the metadata file
     my $url='/res/'.&declutter($filename);      my $url='/res/'.&declutter($filename);
     $url=~s/\.meta$//;      $url=~s/\.meta$//;
     print LOG "    ".$url."\n";      &log(3,"    ".$url) if ($debug);
     #      #
     # Ignore some files based on their metadata      # Ignore some files based on their metadata
     if ($ref->{'obsolete'}) {       if ($ref->{'obsolete'}) { 
         print LOG "obsolete\n";           &log(3,"obsolete") if ($debug);
         return;           return; 
     }      }
     &count_copyright($ref->{'copyright'});      &count_copyright($ref->{'copyright'});
     if ($ref->{'copyright'} eq 'private') {       if ($ref->{'copyright'} eq 'private') { 
         print LOG "private\n";           &log(3,"private") if ($debug);
         return;           return; 
     }      }
     #      #
Line 264  sub process_meta_file { Line 339  sub process_meta_file {
     my %dyn;      my %dyn;
     if ($url=~ m:/default$:) {      if ($url=~ m:/default$:) {
         $url=~ s:/default$:/:;          $url=~ s:/default$:/:;
           &log(3,"Skipping dynamic data") if ($debug);
     } else {      } else {
         # %dyn=&dynamicmeta($url);          &log(3,"Retrieving dynamic data") if ($debug);
           %dyn=&get_dynamic_metadata($url);
         &count_type($url);          &count_type($url);
     }      }
     #      #
Line 276  sub process_meta_file { Line 353  sub process_meta_file {
                 %dyn,                  %dyn,
                 'url'=>$url,                  'url'=>$url,
                 'version'=>'current');                  'version'=>'current');
     my ($count,$err) = &LONCAPA::lonmetadata::store_metadata($dbh,$newname,      if (! $simulate) {
                                                              \%Data);          my ($count,$err) = &LONCAPA::lonmetadata::store_metadata($dbh,$newname,
     if ($err) {                                                                   \%Data);
         print LOG "\nMySQL Error Insert: ".$err."\n";          if ($err) {
         die $err;              &log(0,"MySQL Error Insert: ".$err);
     }              die $err;
     if ($count < 1) {          }
         print LOG "Unable to insert record into MySQL database for $url\n";          if ($count < 1) {
         die "Unable to insert record into MySQl database for $url";              &log(0,"Unable to insert record into MySQL database for $url");
     } else {              die "Unable to insert record into MySQl database for $url";
         print LOG "Count = ".$count."\n";          }
     }      }
     #      #
     # Reset $_ before leaving      # Reset $_ before leaving
Line 366  sub getfile { Line 443  sub getfile {
 ###                                                  ###  ###                                                  ###
 ########################################################  ########################################################
 ########################################################  ########################################################
 sub dynamicmeta {  ##
     my $url = &declutter(shift());  ## Dynamic metadata description
     $url =~ s/\.meta$//;  ##
     my %data = ('count'         => 0,  ##   Field             Type
                 'course'        => 0,  ##-----------------------------------------------------------
                 'course_list'   => '',  ##   count             integer
                 'avetries'      => 'NULL',  ##   course            integer
                 'avetries_list' => '',  ##   course_list       comma seperated list of course ids
                 'stdno'         => 0,  ##   avetries          real                                
                 'stdno_list'    => '',  ##   avetries_list     comma seperated list of real numbers
                 'usage'         => 0,  ##   stdno             real
                 'usage_list'    => '',  ##   stdno_list        comma seperated list of real numbers
                 'goto'          => 0,  ##   usage             integer   
                 'goto_list'     => '',  ##   usage_list        comma seperated list of resources
                 'comefrom'      => 0,  ##   goto              scalar
                 'comefrom_list' => '',  ##   goto_list         comma seperated list of resources
                 'difficulty'    => 'NULL',  ##   comefrom          scalar
                 'difficulty_list' => '',  ##   comefrom_list     comma seperated list of resources
                 'sequsage'      => '0',  ##   difficulty        real
                 'sequsage_list' => '',  ##   difficulty_list   comma seperated list of real numbers
                 'clear'         => 'NULL',  ##   sequsage          scalar
                 'technical'     => 'NULL',  ##   sequsage_list     comma seperated list of resources
                 'correct'       => 'NULL',  ##   clear             real
                 'helpful'       => 'NULL',  ##   technical         real
                 'depth'         => 'NULL',  ##   correct           real
                 'comments'      => '',                  ##   helpful           real
                 );  ##   depth             real
     my ($dom,$auth)=($url=~/^(\w+)\/(\w+)\//);  ##   comments          html of all the comments made
     my $prodir=&propath($dom,$auth);  ##
   {
   
   my %DynamicData;
   my %Counts;
   
   sub process_dynamic_metadata {
       my ($user,$dom) = @_;
       undef(%DynamicData);
       undef(%Counts);
     #      #
     # Get metadata except counts      my $prodir = &propath($dom,$user);
       #
       # Read in the dynamic metadata
     my %evaldata;      my %evaldata;
     if (! tie(%evaldata,'GDBM_File',      if (! tie(%evaldata,'GDBM_File',
               $prodir.'/nohist_resevaldata.db',&GDBM_READER(),0640)) {                $prodir.'/nohist_resevaldata.db',&GDBM_READER(),0640)) {
         return (undef);          return 0;
     }      }
     my %sum=();      #
     my %count=();      # Process every stored element
     my %concat=();      while (my ($storedkey,$value) = each(%evaldata)) {
     my %listitems=(          my ($source,$file,$type) = split('___',$storedkey);
                    'course'       => 'add',          $source = &unescape($source);
                    'goto'         => 'add',          $file = &unescape($file);
                    'comefrom'     => 'add',          $value = &unescape($value);
                    'avetries'     => 'average',           "    got ".$file."\n        ".$type." ".$source."\n";
                    'stdno'        => 'add',          if ($type =~ /^(avetries|count|difficulty|stdno|timestamp)$/) {
                    'difficulty'   => 'average',              #
                    'clear'        => 'average',              # Statistics: $source is course id
                    'technical'    => 'average',              $DynamicData{$file}->{'statistics'}->{$source}->{$type}=$value;
                    'helpful'      => 'average',          } elsif ($type =~ /^(clear|comments|depth|technical|helpful)$/){
                    'correct'      => 'average',              #
                    'depth'        => 'average',              # Evaluation $source is username, check if they evaluated it
                    'comments'     => 'append',              # more than once.  If so, pad the entry with a space.
                    'usage'        => 'count'              while(exists($DynamicData{$file}->{'evaluation'}->{$type}->{$source})) {
                    );                  $source .= ' ';
     #  
     my $regexp=$url;  
     $regexp=~s/(\W)/\\$1/g;  
     $regexp='___'.$regexp.'___([a-z]+)$';  
     while (my ($esckey,$value)=each %evaldata) {  
         my $key=&unescape($esckey);  
         if ($key=~/$regexp/) {  
             my ($item,$purl,$cat)=split(/___/,$key);  
             $count{$cat}++;  
             if ($listitems{$cat} ne 'append') {  
                 if (defined($sum{$cat})) {  
                     $sum{$cat}+=&unescape($value);  
                     $concat{$cat}.=','.$item;  
                 } else {  
                     $sum{$cat}=&unescape($value);  
                     $concat{$cat}=$item;  
                 }  
             } else {  
                 if (defined($sum{$cat})) {  
                     if ($evaldata{$esckey}=~/\w/) {  
                         $sum{$cat}.='<hr />'.&unescape($evaldata{$esckey});  
                     }  
                 } else {  
                     $sum{$cat}=''.&unescape($evaldata{$esckey});  
     }  
             }              }
               $DynamicData{$file}->{'evaluation'}->{$type}->{$source}=$value;
           } elsif ($type =~ /^(course|comefrom|goto|usage)$/) {
               #
               # Context $source is course id or resource
               push(@{$DynamicData{$file}->{$type}},&unescape($source));
           } else {
               &log(0,"   ".$user."@".$dom.":Process metadata: Unable to decode ".$type);
         }          }
     }      }
     untie(%evaldata);      untie(%evaldata);
     # transfer gathered data to returnhash, calculate averages where applicable      #
     my %returnhash;      # Read in the access count data
     while (my $cat=each(%count)) {      &log(7,'Reading access count data') if ($debug);
         if ($count{$cat} eq 'nan') { next; }      my %countdata;
         if ($sum{$cat} eq 'nan') { next; }      if (! tie(%countdata,'GDBM_File',
         if ($listitems{$cat} eq 'average') {                $prodir.'/nohist_accesscount.db',&GDBM_READER(),0640)) {
             if ($count{$cat}) {          return 0;
                 $returnhash{$cat}=int(($sum{$cat}/$count{$cat})*100.0+0.5)/100.0;      }
             } else {      while (my ($key,$count) = each(%countdata)) {
                 $returnhash{$cat}='NULL';          next if ($key !~ /^$dom/);
           $key = &unescape($key);
           &log(8,'    Count '.$key.' = '.$count) if ($debug);
           $Counts{$key}=$count;
       }
       untie(%countdata);
       if ($debug) {
           &log(7,scalar(keys(%Counts)).
                " Counts read for ".$user."@".$dom);
           &log(7,scalar(keys(%DynamicData)).
                " Dynamic metadata read for ".$user."@".$dom);
       }
       #
       return 1;
   }
   
   sub get_dynamic_metadata {
       my ($url) = @_;
       $url =~ s:^/res/::;
       if (! exists($DynamicData{$url})) {
           &log(7,'    No dynamic data for '.$url) if ($debug);
           return ();
       }
       my %data;
       my $resdata = $DynamicData{$url};
       #
       # Get the statistical data
       foreach my $type (qw/avetries difficulty stdno/) {
           my $count;
           my $sum;
           my @Values;
           foreach my $coursedata (values(%{$resdata->{'statistics'}})) {
               if (ref($coursedata) eq 'HASH' && exists($coursedata->{$type})) {
                   $count++;
                   $sum += $coursedata->{$type};
                   push(@Values,$coursedata->{$type});
             }              }
         } elsif ($listitems{$cat} eq 'count') {  
             $returnhash{$cat}=$count{$cat};  
         } else {  
             $returnhash{$cat}=$sum{$cat};  
         }          }
         $returnhash{$cat.'_list'}=$concat{$cat};          if ($count) {
               $data{$type} = $sum/$count;
               $data{$type.'_list'} = join(',',@Values);
           }
       }
       # find the count
       $data{'count'} = $Counts{$url};
       #
       # Get the context data
       foreach my $type (qw/course goto comefrom/) {
           if (defined($resdata->{$type}) && 
               ref($resdata->{$type}) eq 'ARRAY') {
               $data{$type} = scalar(@{$resdata->{$type}});
               $data{$type.'_list'} = join(',',@{$resdata->{$type}});
           }
       }
       if (defined($resdata->{'usage'}) && 
           ref($resdata->{'usage'}) eq 'ARRAY') {
           $data{'sequsage'} = scalar(@{$resdata->{'usage'}});
           $data{'sequsage_list'} = join(',',@{$resdata->{'usage'}});
       }
       #
       # Get the evaluation data
       foreach my $type (qw/clear technical correct helpful depth/) {
           my $count;
           my $sum;
           foreach my $evaluator (keys(%{$resdata->{'evaluation'}->{$type}})){
               $sum += $resdata->{'evaluation'}->{$type}->{$evaluator};
               $count++;
           }
           if ($count > 0) {
               $data{$type}=$sum/$count;
           }
     }      }
     #      #
     # get count      # put together comments
     if (tie(my %evaldata,'GDBM_File',      my $comments = '<div class="LCevalcomments">';
             $prodir.'/nohist_accesscount.db',&GDBM_READER(),0640)) {      foreach my $evaluator (keys(%{$resdata->{'evaluation'}->{'comments'}})){
  my $escurl=&escape($url);          $comments .= $evaluator.':'.
  if (! exists($evaldata{$escurl})) {              $resdata->{'evaluation'}->{'comments'}->{$evaluator}.'<hr />';
     $returnhash{'count'}=0;      }
  } else {      $comments .= '</div>';
     $returnhash{'count'}=$evaldata{$escurl};      #
  }      # Log the dynamic metadata
  untie %evaldata;      if ($debug) {
           while (my($k,$v)=each(%data)) {
               &log(8,"    ".$k." => ".$v);
           }
     }      }
     return %returnhash;      #
       return %data;
 }  }
   
   } # End of %DynamicData and %Counts scope
   
 ########################################################  ########################################################
 ########################################################  ########################################################
 ###                                                  ###  ###                                                  ###
Line 593  sub sqltime { Line 732  sub sqltime {
         $TimeData[5]+=1900;          $TimeData[5]+=1900;
         $mysqltime = sprintf('%04d-%02d-%02d %02d:%02d:%02d',          $mysqltime = sprintf('%04d-%02d-%02d %02d:%02d:%02d',
                              @TimeData[5,4,3,2,1,0]);                               @TimeData[5,4,3,2,1,0]);
       } elsif (! defined($time) || $time == 0) {
           $mysqltime = 0;
     } else {      } else {
         print LOG "    Unable to decode time ".$time."\n";          &log(0,"    sqltime:Unable to decode time ".$time);
         $mysqltime = 0;          $mysqltime = 0;
     }      }
     return $mysqltime;      return $mysqltime;

Removed from v.1.55  
changed lines
  Added in v.1.56


FreeBSD-CVSweb <freebsd-cvsweb@FreeBSD.org>